AI Agent 记忆系统：架构、范式与实战 | 极客日志

编程语言SaaSAI算法

AI Agent 记忆系统：架构、范式与实战

AI Agent 记忆系统涉及工作记忆、长期记忆及多源融合等核心挑战。主流技术路线包括上下文窗口、RAG、文件系统、知识图谱及多 Agent 推理。代表性系统如 Mem0、Zep、OpenClaw 和 ASMR 展示了不同架构优劣。评估基准 LongMemEval 与 LoCoMo 揭示了精度与成本的权衡。未来趋势指向混合架构与标准化基础设施，旨在实现个性化与连续性的长期协作。

鲜活发布于 2026/4/7更新于 2026/7/2644 浏览

近年来，大语言模型驱动的 AI Agent 正在从单次对话工具向长期协作搭档进化。然而，一个根本性的短板始终制约着这一进化——记忆。每次对话结束，Agent 就像一个失忆症患者，忘记了所有交流过的内容。128K 的上下文窗口再大，重开对话就是陌生人。

本文旨在对 AI Agent 记忆系统进行系统性的技术综述，内容涵盖记忆的分类体系、核心技术路线、代表性系统详解、横向对比以及未来发展趋势。

一. 引言：为什么 Agent 需要记忆？

1.1 从工具到搭档的跨越

当前的 LLM 本质上是无状态的函数：给定输入，返回输出，对话结束即遗忘一切。这在单次问答场景下没有问题，但当我们期望 AI 成为长期搭档时，问题就暴露了：

个性化缺失：无法记住用户偏好、工作习惯和历史决策
上下文断裂：每次对话都要重新解释背景
无法学习：同样的错误反复犯，无法从经验中成长
信任难建立：每次见面都是陌生人，何谈信任？

1.2 记忆是 Agent 的最后一块拼图

在 Agent 架构中，感知（Perception）、推理（Reasoning）、行动（Action）三大能力已经通过 LLM + Tool Use 基本实现。但记忆——让 Agent 跨越时间边界保持连续性的能力——仍是一个待攻克的难题。

正如 Supermemory 团队所说：在未来几年，数十亿个 Agent 将会高度个性化，针对每位用户量身定制——持续学习、不断进化。这正是我们深入研究 AI 记忆的原因。

2025 年底，学术界发表的综述论文《Memory in the Age of AI Agents》系统性地梳理了这一领域的研究图景，标志着 Agent 记忆从附加功能正式升级为核心基础设施。

二. 记忆系统的核心挑战：远比存下来复杂

构建一个合格的 Agent 记忆系统，需要解决以下核心难题：

2.1 信息矛盾与时序推理

用户上个月说我住在北京，这个月说我刚搬到上海。系统必须识别出后者覆盖了前者，只返回上海——而不是把两条信息一股脑丢给 LLM 让它猜。

2.2 噪声过滤与精准检索

11.5 万 token 的对话历史中，可能只有 3 句话跟当前问题相关。检索噪声过高，LLM 同样无法有效利用信息。

2.3 自动遗忘

我明天有考试——这条信息在明天过后就应该自动失效，不应变成永久噪声。自动遗忘机制是记忆系统区别于传统数据库的关键特性。

2.4 多源信息融合

Agent 的记忆不仅来自对话，还可能来自邮件、文档、代码仓库、日历等多种来源。如何统一管理和检索这些异构信息？

2.5 隐私与安全

记忆中包含大量个人敏感信息。本地部署 vs 云端托管、数据加密、访问控制、GDPR/EU AI Act 合规——这些都是必须考虑的工程问题。

三. Agent 记忆的分类体系：从人类认知到机器实现

借鉴认知科学中的人类记忆分类，Agent 记忆可以从多个维度进行划分。

3.1 按时间跨度分类

类型	描述	人类类比	Agent 实现
工作记忆	当前对话上下文	短期记忆 / 工作台	LLM 上下文窗口
短期记忆	近期几轮对话	几小时～几天的回忆	会话历史缓存
长期记忆	跨越天、周、月的信息	长期记忆	持久化存储（DB/文件）
情景记忆

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

类型	描述	示例
语义记忆	关于用户的事实性知识	用户是资深工程师，用 Vim
情景记忆	具体事件及其上下文	上周三讨论了认证模块迁移
程序记忆	如何执行某个任务	部署时需要先跑测试
元记忆	关于记忆本身的知识	这条信息是上周更新的

形式	代表系统	优势	劣势
向量数据库	Mem0, Zep	语义检索强	时序推理弱
知识图谱	Cognee, Mem0 Graph	关系推理强	构建成本高
文件系统	OpenClaw, Letta FS	透明可编辑	检索精度受限
关系数据库	Zep (Postgres)	结构化查询	语义理解弱
纯内存	ASMR	速度快，可嵌入	持久化待解决

[System Prompt] + [历史对话] + [当前问题] → LLM →回答

用户问题 → Embedding → 向量检索 → Top-K chunks → 注入上下文 → LLM → 回答

MEMORY.md（长期记忆） memory/2026-03-23.md（每日笔记） USER.md（用户画像）

[用户：张三] --居住在--> [城市：上海] [用户：张三] --使用工具--> [编辑器：Vim] [事件：认证迁移] --时间--> [2026-03-15] [事件：认证迁移] --参与者--> [用户：张三]

用户问题 → 编排器 → [搜索 Agent1: 直接事实] + [搜索 Agent2: 上下文线索] + [搜索 Agent3: 时间线重建] → 汇总验证 → [8-12 个专家 Agent 并行回答] → 投票/裁判 → 最终答案

Markdown 文件 ↓ 文件监听 (watch) 分块 (400 tokens, 重叠 80) ↓ Embedding (text-embedding-3-small 等) ↓ SQLite 存储 (chunks 表 + FTS5 虚拟表) ↓ Hybrid Search (向量 + 全文混合) ↓ 后处理 MMR 去重 + 时序衰减 + 引用溯源 ↓ 注入 LLM 上下文

原始对话 ↓ 3 个观察者 Agent 并行读取 (Gemini 2.0 Flash) ↓ 提取六维结构化知识 [个人信息 | 偏好 | 事件 | 时序数据 | 信息更新 | 助手信息] ↓ 存储 + 源映射 用户问题到来 ↓ 3 个搜索 Agent 并行推理 [Agent1: 直接事实] [Agent2: 上下文线索] [Agent3: 时间线重建] ↓ 汇总 + 逐字验证 8-12 个专家 Agent 并行回答 ↓ 多数投票 / 聚合裁判 最终答案

维度	Mem0	Zep	Letta	Cognee	MemOS	OpenClaw	ASMR
存储后端	向量 DB+ 图谱	PostgreSQL	分层内存	图数据库	分层架构	SQLite	纯内存
需要 Embedding	✅	✅	✅	✅	✅	✅	❌
检索方式	向量 + 图谱	向量 + 事实	Agent 自主	图查询	统一 API	混合检索	Agent 推理
信息矛盾处理	✅ 自动更新	✅ 冲突解决	部分	✅ 图更新	✅	❌	✅ Agent 推理
自动遗忘	✅	✅	❌	❌	✅	❌	✅
部署模式	云 + 自部署	云 + 自部署	自部署	自部署	自部署	本地	未明确
开源	✅	部分	✅	✅	✅	✅	4 月开源
多语言支持	依赖 Embedding	依赖 Embedding	依赖 LLM	依赖 LLM	依赖 Embedding	✅ 8 种语言 FTS	依赖 LLM
隐私友好	⚠️ 云端	⚠️ 云端	✅ 本地	✅ 本地	✅ 本地	✅✅ 全本地	未明确

系统	LongMemEval-s	LoCoMo	备注
ASMR 8 变体	~98.6%	-	实验性，非生产
ASMR 12 变体	~97.2%	-	单一共识答案
MemOS-0630	-	排名第一	超越所有对手
Supermemory v1	~85%	-	2025 年首版
Letta Filesystem	-	74.0%	纯文件系统！
OpenClaw	未公开	未公开	生产系统
Mem0	未公开	未公开	商业系统
Zep	未公开	未公开	商业系统

模式	代表	隐私性	便利性
全本地	OpenClaw	⭐⭐⭐⭐⭐	⭐⭐⭐
自部署云	Letta, Cognee	⭐⭐⭐⭐	⭐⭐⭐⭐
托管 SaaS	Mem0 Cloud, Zep Cloud	⭐⭐	⭐⭐⭐⭐⭐

维度	描述
准确率	检索到的信息是否正确
召回率	是否找到了所有相关信息
时效性	是否返回了最新版本的信息
抗矛盾	面对矛盾信息是否能给出正确答案
延迟	检索到回答的端到端延迟
成本	每次查询的 API / 计算成本

AI Agent 记忆系统：架构、范式与实战

一. 引言：为什么 Agent 需要记忆？

1.1 从工具到搭档的跨越

1.2 记忆是 Agent 的最后一块拼图

二. 记忆系统的核心挑战：远比存下来复杂

2.1 信息矛盾与时序推理

2.2 噪声过滤与精准检索

2.3 自动遗忘

2.4 多源信息融合

2.5 隐私与安全

三. Agent 记忆的分类体系：从人类认知到机器实现

3.1 按时间跨度分类

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 按功能角色分类

3.3 按存储形式分类

四. 主流技术路线：五大范式

4.1 基于上下文窗口的记忆（Context Window）

4.2 基于 RAG 的记忆（Retrieval-Augmented Generation）

4.3 基于文件系统的记忆（Filesystem-Based）

4.4 基于知识图谱的记忆（Graph Memory）

4.5 基于多 Agent 推理的记忆（Agentic Memory）

五. 代表性系统详解

5.1 Mem0：托管式语义记忆平台

5.2 Zep：长期记忆即服务

5.3 Letta（原 MemGPT）：虚拟上下文管理

5.4 Cognee：知识图谱驱动的结构化记忆

5.5 MemOS：记忆操作系统

5.6 OpenClaw：文件 + 向量混合检索记忆

5.7 ASMR（Supermemory）：多 Agent 主动推理记忆

六. 系统横向对比

6.1 架构对比

6.2 基准测试对比（LongMemEval / LoCoMo）

七. 关键设计决策分析

7.1 向量检索 vs Agent 推理检索

7.2 集中式 vs 分布式记忆

7.3 被动存储 vs 主动提取

7.4 精确召回 vs 语义模糊匹配

7.5 隐私与部署模式

八. 评估基准与指标

8.1 LongMemEval

8.2 LoCoMo（Long Conversational Memory）

8.3 关键评估维度

九. 未来展望

9.1 混合架构将成为主流

9.2 记忆将从附加功能变成基础设施层

9.3 标准化与互操作

9.4 多模态记忆

9.5 隐私计算与联邦记忆

参考文献

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具