字节74K星的AI Agent,跑3小时不崩不忘不乱——我拿它干了一整天的活
如果你的AI Agent只能活5分钟,那它不是助手,是弹窗。
你让它"调研竞品、写分析报告、生成PPT",它5分钟后告诉你"搞定了",甩过来200字的摘要。你让它"帮我把这个项目从Python迁移到Go",它写到一半上下文爆了,从零开始。你让它"跟踪这个技术方向一个月的最新进展",它直接告诉你"我记不住之前的了"。
崩、忘、乱——这就是当前AI Agent的三大绝症。
字节跳动74K星的开源项目DeerFlow 2.0,就是来治这个病的。
不是框架,是Harness
先说一个关键概念:DeerFlow 2.0不是框架(framework),它是harness——一套让Agent真正把事情做完的运行时基础设施。
区别在哪?
框架给你零件,你自己拼。Harness给你一辆能开的车,你踩油门就行。
DeerFlow 2.0是字节从v1彻底重写的,和1.x没有共用一行代码。1.x是一个Deep Research框架,2.0是一个Super Agent Harness。这个升级不是功能迭代,是物种进化。
它默认就带上了Agent真正会用到的关键能力:文件系统、记忆、技能、沙箱执行环境、子代理调度。基于LangGraph和LangChain构建,但不需要你自己拼装——开箱即用,同时足够可扩展。
三剂药方,治三大绝症
第一剂:沙箱执行——治"崩"
普通Agent跑复杂任务,5分钟崩一次。为什么?因为它和你的系统共处一个环境——写错文件、吃光内存、网络请求超时,任何一个都能让它挂掉。
DeerFlow的每个任务都在独立Docker容器里运行。完整的文件系统、独立的网络策略、可控的资源配额。Agent在里面随便折腾,搞不崩你的宿主机。
/mnt/user-data/
├── uploads/ ← 你上传的文件
├── workspace/ ← Agent的工作目录
└── outputs/ ← 最终交付物
更狠的是断点续传。任务中断了?从断点恢复继续跑,不用从头来。
本地开发、Docker容器、Kubernetes Pod——三种沙箱模式,从个人开发到企业集群全覆盖。
第二剂:三层记忆——治"忘"
你跟AI聊了3小时,到第4小时它说"我们之前聊了什么?"——这种体验谁都有过。
DeerFlow搞了一套三层记忆系统:
- 短期记忆:当前对话的上下文,保证即时连贯
- 长期记忆:知识图谱,跨session记住你的偏好、知识背景、工作习惯
- 工作记忆:任务执行状态,长任务中间不会"忘了刚才在干什么"
普通Agent上下文窗口一满就丢信息,DeerFlow有专门的摘要压缩机制——总结已完成的子任务、把中间结果转存到文件系统、压缩暂时不重要的信息。不是硬塞更多token,而是聪明地管理有限的上下文空间。
而且记忆数据保存在本地,控制权始终在你手里。
第三剂:子代理协作——治"乱"
复杂任务最怕什么?乱。
一个"调研AI市场"的任务,要搜索、要分析、要写报告、要做PPT。一个人干?效率低。串行干?太慢。
DeerFlow的做法:自动拆解,并行执行。
Lead Agent接到任务后,先做规划,然后按需动态拉起Sub-Agents。每个Sub-Agent都有自己独立的上下文、工具和终止条件。只要条件允许,它们就并行运行,返回结构化结果,最后由Lead Agent汇总。
关键设计细节:每个Sub-Agent的上下文是完全隔离的——它看不到主Agent的上下文,也看不到其他Sub-Agent的上下文。这意味着一个子任务的中间状态不会污染另一个子任务,并行不会互相干扰。
技能系统:像装App一样给Agent装能力
DeerFlow能做"几乎任何事"的秘密,在于它的Skills系统。
Skill就是一个Markdown文件,定义了工作流、最佳实践和参考资源。DeerFlow自带一批内置Skills:
/mnt/skills/public
├── research/SKILL.md ← 深度研究
├── report-generation/SKILL.md ← 报告生成
├── slide-creation/SKILL.md ← PPT制作
├── web-page/SKILL.md ← 网页生成
└── image-generation/SKILL.md ← 图像生成
你也可以自己写:
/mnt/skills/custom
└── your-custom-skill/SKILL.md ← 你的Skill
按需渐进加载——不会一次性把所有Skill塞进上下文,用到哪个加载哪个。
Tools也是同样的思路。内置网页搜索、网页抓取、文件操作、bash执行;同时支持通过MCP Server和Python函数扩展自定义工具。甚至Claude Code也能直接集成——装一个skill就行:
npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow
五大IM渠道,聊天窗口就是Agent控制台
DeerFlow支持从即时通讯应用直接接收任务,不需要公网IP:
| 渠道 | 传输方式 | 上手难度 |
|---|---|---|
| Telegram | Bot API (long-polling) | 简单 |
| Slack | Socket Mode | 中等 |
| 飞书/Lark | WebSocket | 中等 |
| 企业微信 | WebSocket | 中等 |
| 钉钉 | Stream Push (WebSocket) | 中等 |
配置好之后,直接在聊天窗口里发任务就行。还支持几个实用命令:
/new— 开启新对话/status— 查看当前线程信息/models— 列出可用模型/memory— 查看记忆
从"打开终端敲命令"到"在飞书群里说一句话",这个体验差距是巨大的。
Python Client:嵌入式Agent
如果你不想启动完整的Gateway+前端+nginx+Docker那一套,DeerFlow还提供了内嵌Python Client:
from deerflow.client import DeerFlowClient
client = DeerFlowClient()
response = client.chat("帮我分析这篇论文", thread_id="my-thread")
# 流式输出
for event in client.stream("hello"):
if event.type == "messages-tuple" and event.data.get("type") == "ai":
print(event.data["content"])
# 管理模型和技能
models = client.list_models()
skills = client.list_skills()
client.update_skill("web-search", enabled=True)
甚至有终端工作台(TUI),一条命令启动:
uv pip install 'deerflow-harness[tui]'
deerflow # 启动终端UI
deerflow --continue # 恢复最近会话
deerflow --resume THREAD # 按ID恢复指定会话
deerflow --print "总结一下" # 无头模式
部署:Docker一条命令
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config # 生成配置文件
make docker-init # 拉取沙箱镜像
make docker-start # 启动服务
访问 http://localhost:2026 就能用。
模型不强绑定——只要实现了OpenAI兼容API的LLM都能接入。推荐用Doubao-Seed-2.0-Code、DeepSeek v3.2、Kimi 2.5,或者GPT-4、Gemini 2.5 Flash,全凭你选。
| 部署场景 | 起步配置 | 推荐配置 |
|---|---|---|
| 本地体验 | 4核8G | 8核16G |
| Docker开发 | 4核8G | 8核16G |
| 长期服务 | 8核16G | 16核32G |
从Deep Research到Super Agent:路线之争
DeerFlow的演进路径本身就是行业缩影。
1.x时代,它是一个Deep Research框架——专门做深度研究。但上线后,开发者拿它做的事情远超研究:搭数据流水线、生成PPT、快速起Dashboard、自动化内容流程。很多方向连字节自己都没想到。
这暴露了一个行业真相:Agent不该被场景限定。你做一个研究工具,用户拿它搞创作;你做一个编程助手,用户拿它做运营。需求永远跑在产品前面。
所以2.0从头重写,从"研究框架"升级为"Super Agent Harness"——不是给你一个锤子让你找钉子,而是给你一个工具箱,什么钉子都能敲。
这个思路和Mem0(生化危机女主做的AI记忆系统)的路线之争一样:是做垂直场景的精致工具,还是做通用基础设施?DeerFlow 2.0的回答很明确——做harness,不做framework。
一句话总结
DeerFlow 2.0让你用一个Super Agent框架,替代手动任务拆解+多工具切换+结果汇总,几小时的长任务稳跑到底——不崩、不忘、不乱。
GitHub地址:https://github.com/bytedance/deer-flow
74K星,MIT协议,字节级工程品质。值得一个Star。
觉得有用?转发给还在被AI Agent折磨的朋友。
暂无评论。