近年来,大语言模型驱动的 AI Agent 正在从单次对话工具向长期协作搭档进化。然而,一个根本性的短板始终制约着这一进化——记忆。每次对话结束,Agent 就像一个失忆症患者,忘记了所有交流过的内容。128K 的上下文窗口再大,重开对话就是陌生人。
本文旨在对 AI Agent 记忆系统进行系统性的技术综述,内容涵盖记忆的分类体系、核心技术路线、代表性系统详解、横向对比以及未来发展趋势。
一. 引言:为什么 Agent 需要记忆?
1.1 从工具到搭档的跨越
当前的 LLM 本质上是无状态的函数:给定输入,返回输出,对话结束即遗忘一切。这在单次问答场景下没有问题,但当我们期望 AI 成为长期搭档时,问题就暴露了:
- 个性化缺失:无法记住用户偏好、工作习惯和历史决策
- 上下文断裂:每次对话都要重新解释背景
- 无法学习:同样的错误反复犯,无法从经验中成长
- 信任难建立:每次见面都是陌生人,何谈信任?
1.2 记忆是 Agent 的最后一块拼图
在 Agent 架构中,感知(Perception)、推理(Reasoning)、行动(Action)三大能力已经通过 LLM + Tool Use 基本实现。但记忆——让 Agent 跨越时间边界保持连续性的能力——仍是一个待攻克的难题。
正如 Supermemory 团队所说:在未来几年,数十亿个 Agent 将会高度个性化,针对每位用户量身定制——持续学习、不断进化。这正是我们深入研究 AI 记忆的原因。
2025 年底,学术界发表的综述论文《Memory in the Age of AI Agents》系统性地梳理了这一领域的研究图景,标志着 Agent 记忆从附加功能正式升级为核心基础设施。
二. 记忆系统的核心挑战:远比存下来复杂
构建一个合格的 Agent 记忆系统,需要解决以下核心难题:
2.1 信息矛盾与时序推理
用户上个月说我住在北京,这个月说我刚搬到上海。系统必须识别出后者覆盖了前者,只返回上海——而不是把两条信息一股脑丢给 LLM 让它猜。
2.2 噪声过滤与精准检索
11.5 万 token 的对话历史中,可能只有 3 句话跟当前问题相关。检索噪声过高,LLM 同样无法有效利用信息。
2.3 自动遗忘
我明天有考试——这条信息在明天过后就应该自动失效,不应变成永久噪声。自动遗忘机制是记忆系统区别于传统数据库的关键特性。
2.4 多源信息融合
Agent 的记忆不仅来自对话,还可能来自邮件、文档、代码仓库、日历等多种来源。如何统一管理和检索这些异构信息?
2.5 隐私与安全
记忆中包含大量个人敏感信息。本地部署 vs 云端托管、数据加密、访问控制、GDPR/EU AI Act 合规——这些都是必须考虑的工程问题。
三. Agent 记忆的分类体系:从人类认知到机器实现
借鉴认知科学中的人类记忆分类,Agent 记忆可以从多个维度进行划分。
3.1 按时间跨度分类
| 类型 | 描述 | 人类类比 | Agent 实现 |
|---|---|---|---|
| 工作记忆 | 当前对话上下文 | 短期记忆 / 工作台 | LLM 上下文窗口 |
| 短期记忆 | 近期几轮对话 | 几小时~几天的回忆 | 会话历史缓存 |
| 长期记忆 | 跨越天、周、月的信息 | 长期记忆 | 持久化存储(DB/文件) |
| 情景记忆 |


