1M 上下文模型免费了：三周烧掉万亿 Token，这家公司还没收费

AI 免费API Agnes AI 1M上下文 4K生图

发布于 2026-06-23 11:09:26 4 次浏览

1M 上下文模型免费了：三周烧掉万亿 Token，这家公司还没收费

1M 上下文。免费。

这两个词放在一起，在 2026 年的 AI 圈里不太正常。1M 上下文意味着你能把整本《三体》三部曲塞进去还有余，目前能做到这个长度的模型，GPT-4.1 收 2 美元/百万输入 token，Gemini 2.5 Pro 虽然有 1M 但也要按量计费。Agnes AI 的 Agnes-2.0-Flash 直接免费，不绑卡、不试用、不阉割。

三周前我写过这家新加坡公司——文本、图片、视频三个模型 API 全免费。当时评论区最多的声音是：撑不了多久吧？

三周过去了。没跑路，还更新了两个大能力。

这次更新了什么

文本模型：上下文窗口从 128K 拉到 1M（100 万 Token），最大输出也到了 65.5K Token。能读长也能写长。

图片模型：新出 Agnes-Image-2.1-Flash，输出分辨率从 2K 升到 4K（3840×2160），1K/2K/3K/4K 四档可选，1:1/3:4/4:3/16:9/9:16 多种比例。还能做背景替换、局部修改、图片文字编辑、图像修复。

视频模型 Agnes-Video-V2.0 没有大改，但首周就生成了 200 万秒视频。

三周干了什么量

Agnes AI 从 6 月 1 日开始免费，官方在 LinkedIn 上公布了首周数据：

文本模型处理量超过 1 万亿 Token
图片模型生成超过 200 万张图
视频模型生成超过 200 万秒视频

到第三周，周 token 用量已经涨到 3.12 万亿。这个量级不是摆设。

1 万亿 Token 的服务器成本是多少？按最保守的估算，bfloat16 推理的 GPU 时成本，光文本模型一周就要烧掉数十万美元。图片和视频模型更贵。

三周下来，光推理成本已经是七位数美金级别。免费，还在跑。

1M 上下文到底解决什么问题

很多人觉得「上下文长」就是「能输入更多字」。这是最大的误解。

128K 的上下文，大概是一本小说的量。处理日常文档够用，但遇到长文档、代码项目、Agent 多轮对话，就开始捉襟见肘——你得先切片、再摘要、再拼回去，中间丢信息是常有的事。

1M 上下文真正解决的是工程负担：

长文档分析——产品文档、技术规范、会议纪要、行业研报，一股脑丢进去，模型自己找重点。不用你提前做摘要，不用你切块分段。

代码项目理解——多个源文件、接口文档、修改记录全部放进上下文，让模型理解整个项目再做代码解释或 Bug 定位。以前用 Claude Code 做 Agent 编程，上下文不够就要反复压缩和清理，现在一次塞进去就行。

Agent 多步骤任务——Agent 执行任务时要规划、调用工具、读取结果、修正计划。上下文越长，模型越不容易「忘事」。128K 的上下文，Agent 执行到第 20 步可能就开始丢失早期信息。1M 上下文，跑上百步还稳。

还有一个容易被忽视的点：Agnes-2.0-Flash 原生支持 Function Calling、Tool Use 和结构化输出。这意味着它不是只能聊天的文本模型，而是能直接构建 Agent 工作流的全能选手——多步骤工具调用、联网搜索、文件处理、自定义知识库，API 层面全支持。

4K 生图：从「能看」到「能用」

2K 的图放到大屏上会糊，裁切后排版受限。对做海报、电商图、社媒封面的人来说，分辨率直接决定了生成图是「参考素材」还是「可交付成品」。

4K 输出的好处很直接：

生成图更接近可交付素材，不需要再超分放大
裁切后不会模糊，后期编辑空间更大
细节保留更多，文字、纹理、边缘都更干净

Agnes-Image-2.1-Flash 还能做图片编辑——背景替换、局部修改、图片文字编辑、图像修复。等于一个生成+修图二合一的工具，还是免费的。

接入方式：改一行 URL 就行

Agnes AI 的 API 兼容 OpenAI 格式。你现有的工具链基本不用改，换一下 base_url 和 model 就能跑：

API 地址：https://apihub.agnes-ai.com/v1
文本模型：agnes-2.0-flash（1M 上下文）
图片模型：agnes-image-2.1-flash（4K 输出）
视频模型：agnes-video-v2.0
注册地址：https://platform.agnes-ai.com/

支持 WorkBuddy、Claude CLI、Cherry Studio、Cursor、Codex CLI 等工具直接接入。如果你在用 OpenAI 的 API，把 base_url 从 https://api.openai.com/v1 改成 https://apihub.agnes-ai.com/v1，model 改成 agnes-2.0-flash，其他代码一行不动。

如果你用的是 OpenModel（https://www.openmodel.ai?ref=wYOxNxlv），Agnes 系列模型也已经在列表里了，一行命令切换。

免费能撑多久

这是所有人最关心的问题。我也不确定。

但有几个事实可以参考：

Agnes AI 背后是 Sapiens AI，新加坡公司，正在以 1 亿美元估值融资
Agora（纳斯达克上市公司 API）在为 Agnes AI 提供底层实时通信基础设施
官方明确说「indefinitely free」——无限期免费，不是试用期
首周 1 万亿 Token、第三周 3.12 万亿的用量，说明不是无人问津的空头支票

免费模式的商业逻辑，大概率跟 API 网关行业一样——用免费模型拉开发者生态，在生态上做增值服务和企业版。国内 CDN、云存储都走过这条路，先把用户量做大，再变现。

对开发者来说，现阶段就是纯红利期。1M 上下文 + Function Calling + 4K 生图 + 视频生成，全部免费。等哪天开始收费了，你损失的无非是把 base_url 改回去的成本。

一个提醒

免费不代表没有限制。Agnes AI 目前有速率限制（rate limit），高并发场景下可能会遇到 429 错误。如果你要跑生产级服务，还是得考虑备选方案。

另外，免费模型的隐私政策需要自己确认。敏感数据是否经过训练、是否被用于模型改进，这些在官方文档里有说明，建议用过之前先看一眼。

1M 上下文免费开放这件事，无论最终能撑多久，它已经把行业的水位抬上去了。以后再有人想收 1M 上下文的钱，得先回答一个问题：别人免费都能做，你凭什么收费？

注册地址：https://platform.agnes-ai.com/

API 文档：https://agnes-ai.com/doc/agnes-20-flash