想象你雇了一个 秘书 帮你处理事务。
她多了三样东西:
写便签、存档案、查档案。
这就是 MemGPT 论文最核心的想法:让 LLM 自己管理自己的记忆,就像操作系统管理内存一样。
RAG(Retrieval-Augmented Generation,检索增强生成)你大概听过: 把一堆文档切片塞进向量数据库,用户提问时检索相关片段拼进 prompt。
表面上看,Letta 也有向量库、也做检索,好像就是 RAG?不是。区别在四个维度:
| 维度 | 传统 RAG | MemGPT / Letta |
|---|---|---|
| 记什么 | 静态知识库(产品手册、论文、wiki) | 会话中动态产生的事实("用户女儿叫 Lily"、"上次决定用 Postgres") |
| 谁来写 | 工程师离线灌库,用户不参与 | Agent 自己在对话中判断并写入 |
| 何时检索 | 每次用户提问都无脑检索一次 | Agent 判断需要时才主动调用 search 工具 |
| 常驻记忆 | 没有,每次都是现查现用 | 有便签区(Working Context),关键信息始终在眼前 |
它们不冲突。Letta 里完全可以再接一个 RAG 来查产品手册—— 秘书一边记你的偏好(Letta 的活),一边翻公司规章(RAG 的活)。
项目地址:github.com/letta-ai/letta
如果你是第一次接触,建议这个顺序: