1M 上下文模型免费了:三周烧掉万亿 Token,这家公司还没收费

1M 上下文模型免费了:三周烧掉万亿 Token,这家公司还没收费

1M 上下文。免费。

这两个词放在一起,在 2026 年的 AI 圈里不太正常。1M 上下文意味着你能把整本《三体》三部曲塞进去还有余,目前能做到这个长度的模型,GPT-4.1 收 2 美元/百万输入 token,Gemini 2.5 Pro 虽然有 1M 但也要按量计费。Agnes AI 的 Agnes-2.0-Flash 直接免费,不绑卡、不试用、不阉割。

三周前我写过这家新加坡公司——文本、图片、视频三个模型 API 全免费。当时评论区最多的声音是:撑不了多久吧?

三周过去了。没跑路,还更新了两个大能力。

这次更新了什么

文本模型:上下文窗口从 128K 拉到 1M(100 万 Token),最大输出也到了 65.5K Token。能读长也能写长。

图片模型:新出 Agnes-Image-2.1-Flash,输出分辨率从 2K 升到 4K(3840×2160),1K/2K/3K/4K 四档可选,1:1/3:4/4:3/16:9/9:16 多种比例。还能做背景替换、局部修改、图片文字编辑、图像修复。

视频模型 Agnes-Video-V2.0 没有大改,但首周就生成了 200 万秒视频。

三周干了什么量

Agnes AI 从 6 月 1 日开始免费,官方在 LinkedIn 上公布了首周数据:

  • 文本模型处理量超过 1 万亿 Token
  • 图片模型生成超过 200 万张图
  • 视频模型生成超过 200 万秒视频

到第三周,周 token 用量已经涨到 3.12 万亿。这个量级不是摆设。

1 万亿 Token 的服务器成本是多少?按最保守的估算,bfloat16 推理的 GPU 时成本,光文本模型一周就要烧掉数十万美元。图片和视频模型更贵。

三周下来,光推理成本已经是七位数美金级别。免费,还在跑。

1M 上下文到底解决什么问题

很多人觉得「上下文长」就是「能输入更多字」。这是最大的误解。

128K 的上下文,大概是一本小说的量。处理日常文档够用,但遇到长文档、代码项目、Agent 多轮对话,就开始捉襟见肘——你得先切片、再摘要、再拼回去,中间丢信息是常有的事。

1M 上下文真正解决的是工程负担

长文档分析——产品文档、技术规范、会议纪要、行业研报,一股脑丢进去,模型自己找重点。不用你提前做摘要,不用你切块分段。

代码项目理解——多个源文件、接口文档、修改记录全部放进上下文,让模型理解整个项目再做代码解释或 Bug 定位。以前用 Claude Code 做 Agent 编程,上下文不够就要反复压缩和清理,现在一次塞进去就行。

Agent 多步骤任务——Agent 执行任务时要规划、调用工具、读取结果、修正计划。上下文越长,模型越不容易「忘事」。128K 的上下文,Agent 执行到第 20 步可能就开始丢失早期信息。1M 上下文,跑上百步还稳。

还有一个容易被忽视的点:Agnes-2.0-Flash 原生支持 Function Calling、Tool Use 和结构化输出。这意味着它不是只能聊天的文本模型,而是能直接构建 Agent 工作流的全能选手——多步骤工具调用、联网搜索、文件处理、自定义知识库,API 层面全支持。

4K 生图:从「能看」到「能用」

2K 的图放到大屏上会糊,裁切后排版受限。对做海报、电商图、社媒封面的人来说,分辨率直接决定了生成图是「参考素材」还是「可交付成品」。

4K 输出的好处很直接:

  • 生成图更接近可交付素材,不需要再超分放大
  • 裁切后不会模糊,后期编辑空间更大
  • 细节保留更多,文字、纹理、边缘都更干净

Agnes-Image-2.1-Flash 还能做图片编辑——背景替换、局部修改、图片文字编辑、图像修复。等于一个生成+修图二合一的工具,还是免费的。

接入方式:改一行 URL 就行

Agnes AI 的 API 兼容 OpenAI 格式。你现有的工具链基本不用改,换一下 base_url 和 model 就能跑:

  • API 地址https://apihub.agnes-ai.com/v1
  • 文本模型agnes-2.0-flash(1M 上下文)
  • 图片模型agnes-image-2.1-flash(4K 输出)
  • 视频模型agnes-video-v2.0
  • 注册地址https://platform.agnes-ai.com/

支持 WorkBuddy、Claude CLI、Cherry Studio、Cursor、Codex CLI 等工具直接接入。如果你在用 OpenAI 的 API,把 base_urlhttps://api.openai.com/v1 改成 https://apihub.agnes-ai.com/v1,model 改成 agnes-2.0-flash,其他代码一行不动。

如果你用的是 OpenModel(https://www.openmodel.ai?ref=wYOxNxlv),Agnes 系列模型也已经在列表里了,一行命令切换。

免费能撑多久

这是所有人最关心的问题。我也不确定。

但有几个事实可以参考:

  • Agnes AI 背后是 Sapiens AI,新加坡公司,正在以 1 亿美元估值融资
  • Agora(纳斯达克上市公司 API)在为 Agnes AI 提供底层实时通信基础设施
  • 官方明确说「indefinitely free」——无限期免费,不是试用期
  • 首周 1 万亿 Token、第三周 3.12 万亿的用量,说明不是无人问津的空头支票

免费模式的商业逻辑,大概率跟 API 网关行业一样——用免费模型拉开发者生态,在生态上做增值服务和企业版。国内 CDN、云存储都走过这条路,先把用户量做大,再变现。

对开发者来说,现阶段就是纯红利期。1M 上下文 + Function Calling + 4K 生图 + 视频生成,全部免费。等哪天开始收费了,你损失的无非是把 base_url 改回去的成本。

一个提醒

免费不代表没有限制。Agnes AI 目前有速率限制(rate limit),高并发场景下可能会遇到 429 错误。如果你要跑生产级服务,还是得考虑备选方案。

另外,免费模型的隐私政策需要自己确认。敏感数据是否经过训练、是否被用于模型改进,这些在官方文档里有说明,建议用过之前先看一眼。

1M 上下文免费开放这件事,无论最终能撑多久,它已经把行业的水位抬上去了。以后再有人想收 1M 上下文的钱,得先回答一个问题:别人免费都能做,你凭什么收费?


注册地址https://platform.agnes-ai.com/

API 文档https://agnes-ai.com/doc/agnes-20-flash

评论

暂无评论。

登录后可发表评论。