生化危机女主做的AI记忆系统56k星背后是路线之争

生化危机女主做的AI记忆系统,56k星背后是路线之争

56,268 颗星。56,268 个开发者给一个AI记忆项目点了Star。

不是OpenAI做的。不是Google做的。

是一个好莱坞女演员做的。


Milla Jovovich——对,就是《生化危机》里那个开枪比说话多的Alice——和她的搭档Ben Sigman,花了几个月用Claude Code写了一个叫MemPalace的开源项目。

它的宣言很狂:The best-benchmarked open-source AI memory system. And it's free.

翻译:我们测得最全,还不要钱。

GitHub地址:github.com/MemPalace/mempalace

  • Stars:56,268(截至2026年6月24日)
  • Forks:7,284
  • 语言:Python
  • 协议:MIT(商用免费)
  • 核心依赖:ChromaDB + PyYAML

但这个项目真正有意思的,不是谁做的,也不是多少星。

是它和另一个59k星的Mem0之间,藏着两条完全不同的技术路线。


两条路:存原文 vs 存经验

AI Agent的记忆问题,说白了就一句话:模型没有硬盘。

你关掉对话,它就把你说过的一切扔了。你的偏好、你的项目结构、你纠正过它的错误——全没了。

RAG能解决一部分,但它更像一个"外接硬盘":你问,它查,答完拉倒。它不会记住你上周说过"不要用异步写法",也不会三天后提醒你"这个需求你之前否决过"。

怎么解决?目前有两条路。

路线A:MemPalace——存原文,0 API调用

MemPalace的做法很硬核:把对话原封不动存下来,用regex和关键词评分来分类和检索。

它的记忆分四层:

层级 内容 作用
工作记忆 当前对话窗口上下文 单轮任务不跑偏
情节记忆 最近N轮对话摘要 跨会话continuity
语义记忆 压缩去重后的"事实" RAG存文档,它存经验
知识图谱 实体-关系图 沿关系链推理

关键细节:记忆基础设施完全不用LLM。 分类、分块、检索全靠regex启发式和关键词评分。LLM只负责实际对话。

结果是:零API成本,纯本地,完全确定性。

官方Benchmark:96.6% R@5 on LongMemEval,hybrid模式100%。

听起来很猛。

路线B:Mem0——存经验,用LLM提炼

Mem0(发音mem-zero)走的是完全相反的路:让LLM自动从对话中提取关键信息,压缩成紧凑的记忆条目。

它不管原文。它只存"提炼后的知识点"。

比如你说了20轮对话,Mem0可能只存3条:

  • "用户偏好Python的dataclass"
  • "项目A使用FastAPI"
  • "性能优先于可读性"

Mem0也分三层:用户记忆、会话记忆、Agent记忆。底层是向量+图谱+键值的三合一存储。冲突时自动合并去重,不会重复存。

它还有$24M的A轮融资,Y Combinator孵化的,有完整的托管平台。

GitHub:59,331 Star / 6,849 Fork。


Benchmark争议:96.6%是真的吗?

MemPalace官方宣称96.6% R@5 on LongMemEval。

社区立刻开始压力测试。

独立测试者(GitHub Issue #39)跑了完整管道,得到的结果是82.6% QA accuracy——不错,但和96.6%差了14个百分点。

原因在于指标不对等

系统 指标 分数
MemPalace 检索召回率 R@5 96.6%
OMEGA QA准确率 95.4%
独立测试MemPalace QA准确率 82.6%
agentmemory R@5 95.2%

MemPalace用的是"检索召回"——你问它,它能不能把相关记忆找出来。但找到≠答对。

而agentmemory(另一个竞品)的BM25+Vector方案在R@10上甚至反超MemPalace:98.6% vs ~97.6%。

换句话说,96.6%不是假的,但也不是你以为的那个意思。

Mem0这边也没好到哪去。在LongMemEval-S上,Mem0用GPT-4o跑出49.0%,而Zep/Graphiti跑到63.8%——差了15个百分点。

Benchmark这个东西,谁跑谁赢。


冷水时间

两个项目都很猛,但都有硬伤。

MemPalace的问题:

  1. 记忆垃圾回收不完善——长期记忆会膨胀,靠手动清理。一个跑了3个月的Agent,记忆库可能塞满过时信息
  2. 多Agent共享记忆未验证——Claude Code和Cursor同时用,记忆会不会打架?官方没说
  3. API还在快速迭代——今天写的代码,下个月可能不能用
  4. **"Milla Jovovich写了这代码"**——Reddit上很多人质疑这是营销操作。更有可能是一个CEO雇了工程师,工程师删号后让Milla当前置。这不影响代码质量,但影响信任

Mem0的问题:

  1. 自托管版阉割严重——自动冲突解决、托管图记忆都没了,得自己搭
  2. 依赖LLM调用——记忆提取每次都要调API,成本不可忽略。免费层每月只给1000条记忆
  3. 对长尾场景召回弱——用户偏好、事实类记忆做得好,但需要推理的场景("为什么上次否决了这个方案")召回率骤降
  4. 闭源平台的锁定风险——免费层只是诱饵,生产用量必须付费

还有一个两方都没解决的问题:记忆投毒。

Mem0自己6月22日刚发了篇文章承认——恶意输入可以污染Agent的记忆,让它在后续对话中做出错误决策。这是OWASP ASI06级别的安全漏洞,目前没有好的防御方案。


5分钟上手

如果你就想试一下,两个都很快。

MemPalace:

pip install mempalace
mempalace serve --port 8000

接入Claude Code(MCP):

{
  "mcpServers": {
    "memory": {
      "command": "mempalace",
      "args": ["mcp"]
    }
  }
}

Mem0:

pip install mem0ai
from mem0 import Memory
m = Memory()
m.add("我喜欢用Python的dataclass", user_id="lininn")
result = m.search("Python", user_id="lininn")

MemPalace完全本地,零成本。Mem0有云平台,但也意味着数据上别人的服务器。

选哪个?取决于你信"原文可追溯"还是信"AI提炼更高效"。


这场战争的本质

2026年的Agent赛道有个共识:能跑通的Agent和跑不通的Agent,差距不在模型能力,在记忆设计。

当大家都能调用GPT-5.5、Claude 4、DeepSeek V4的时候,决定Agent好不好用的,不是"模型懂不懂",而是"Agent记不记得"。

MemPalace代表一种哲学:记忆是文件系统问题。 存原文,用确定性算法检索,不依赖黑箱。

Mem0代表另一种:记忆是认知问题。 让LLM自己决定什么值得记,怎么记,什么时候忘。

两条路都在狂奔。MemPalace两个月从0到56k星,Mem0三年攒到59k星拿了$24M融资。

但说到底,它们的起点都一样——一个荒谬的事实:2026年了,世界上最聪明的AI,关掉窗口就失忆。

这不正常。

而正常人不会觉得这不正常。


项目数据截至2026年6月24日。MemPalace: github.com/MemPalace/mempalace | Mem0: github.com/mem0ai/mem0

评论

暂无评论。

登录后可发表评论。