基于 LangGraph 与 Mem0 实现 AI Agent 的长期记忆与个性化体验

AI Agent（智能体）的记忆能力被视为构建高级人工智能应用的基础。它负责提取、存储会话中的重要信息，并支持后续的检索与使用。记忆通常分为短期记忆与长期记忆：短期记忆用于缓存单次会话的上下文与推理过程；而长期记忆则为 AI 智能体提供了持久的重要信息存储与快速检索能力，使其能够跨越多次交互记住用户偏好。

目前，无论是 LangChain、LlamaIndex 等底层 LLM 框架，还是低代码平台，在短期记忆（Context Window/Session History）方面已有相对完善的解决方案。但在长期记忆能力的实现上，特别是更智能的个性化记忆能力，往往存在不足。传统的 RAG（检索增强生成）方案侧重于知识库检索，而非用户个人历史的动态记忆管理。

本文介绍一种广受欢迎的 AI 记忆开源解决方案：Mem0。Mem0 是一个专为基于 LLM 的 AI 应用设计的独立记忆层，旨在解决跨应用、跨会话的持久化、智能化记忆问题。

一、AI 应用需要怎样的长期记忆

在实际应用场景中，我们希望 AI 应用能够提供一种更个性化的人工智能体验。随着时间推移，AI 应能记住每个使用者的独特信息，包括个人资料、专业细节、偏好、个人计划、习惯等，并在未来的交互中轻松检索这些信息，从而实现更具针对性的服务。

典型的应用场景包括：

个性化的 AI 学习助手：记住不同学员的学习特点、薄弱环节与习惯，提供定制化的教学路径。
个性化的 AI 客户服务：根据客户的历史交互记录、购买偏好与投诉历史，提供更智能的服务响应。
个性化的 AI 个人助理：根据个人日程偏好、沟通风格与生活习惯，提供更有吸引力的日程管理与建议。
个性化的 AI 医疗咨询：根据咨询者的既往病史、用药记录与过敏信息，辅助医生或系统做出更精准的健康建议。

这些需求的核心在于信息需要在跨越多用户、多次会话、甚至多个 AI 应用时保留与高效检索。

此外，参考人类的记忆机制，理想的 AI 长期记忆还应具备以下特性：

智能记忆提取：并非简单存储对话历史，而是通过 LLM 理解语义，提取重要事实与关联信息。例如，从旅游规划对话中识别客户偏好的酒店类型、出行频率及预算范围。
自适应学习：随着用户不断使用，系统能持续提高个性化信息的丰富性与准确性。例如，在多次对话中逐步完善对客户职业背景与兴趣爱好的画像。
动态更新与遗忘：根据新的交互信息动态更新记忆内容，同时及时遗忘过时信息。例如，当识别到使用者工作发生变动时，自动更新之前的职业记忆。
精准的检索与响应：优先召回最近且最相关的记忆信息，确保上下文的时效性。例如，回忆客户最近的用餐爱好进行推荐，而非半年前的偏好。

以上这些能力要求，正是 Mem0 已经具备的核心特性。

二、Mem0 的工作原理与架构

简单来说，Mem0 就是为基于 LLM 的 AI 应用而设计的独立记忆层。它通过 API 帮助 AI 应用实现跨应用的持久、智能、自适应与动态的长期记忆与回忆能力。

核心构成

Mem0 的主要工作流程依赖于以下几个关键组件：

记忆管理 API：提供简单的接口（如 add, search, update）集成到现有应用中。
LLM 与嵌入模型：利用大语言模型进行智能的信息提取、摘要与更新；利用嵌入模型将记忆转化为向量表示。
向量数据库或图数据库：作为后端存储，组织、存储与检索记忆向量。支持 Chroma、Pinecone、Weaviate 等多种存储后端。

处理流程

以添加记忆（add 方法）为例，其核心处理过程如下：

输入接收：接收原始对话文本或事件描述。
LLM 提取：调用 LLM 分析输入，提取关键事实（Facts），过滤噪音，判断是否需要更新现有记忆。
：将提取出的记忆事实转换为向量。

# 定义 LangGraph 的 State class State(TypedDict): messages: Annotated[List[HumanMessage | AIMessage], add_messages] mem0_user_id: str # 调用搜索引擎的工具节点，利用 ToolNode 构建 tools = [TavilySearchResults(max_results=1)] tool_node = ToolNode(tools) # 定义 chatbot 节点逻辑 def chatbot(state: State): messages = state["messages"] user_id = state["mem0_user_id"] # 取出关联的个性化记忆，并组装成 context，放在 system message 中 # 注意：这里使用了 search 方法，传入当前消息内容和用户 ID memories = mem0.search(messages[-1].content, user_id=user_id)["results"] context = "历史对话中的相关信息有：\n" for memory in memories: context += f"- {memory['memory']}\n" # 构建 System Message，注入个性化上下文 system_message = SystemMessage( content=f"你是一个乐于助人的客户支持助手。利用所提供的上下文来个性化你的回复，并会记住用户的偏好和过去的交互。\n{context}" ) # 组装消息，并调用 LLM（注意绑定工具） full_messages = [system_message] + messages llm = ChatOpenAI(model="gpt-4o-mini").bind_tools(tools) response = llm.invoke(full_messages) # 记住本地对话的信息 # 将本轮对话的用户输入和助手输出一起添加到记忆中 conversation_text = f"User: {messages[-1].content}\nAssistant: {response.content}" mem0.add(conversation_text, user_id=user_id) return {"messages": [response]} # 辅助方法：判断是否需要调用工具 # 根据大模型的反馈来决定是结束，还是调用工具 # 如果 LLM 返回了 tool_calls，则继续执行搜索节点 # 否则结束对话 def should_continue(state): messages = state["messages"] last_message = messages[-1] if not last_message.tool_calls: return "end" else: return "continue" # 定义一个 graph 工作流 workflow = StateGraph(State) workflow.add_node("llm", chatbot) workflow.add_node("search", tool_node) workflow.set_entry_point("llm") # 添加条件边：从 agent 出来的两个分支及条件 workflow.add_conditional_edges( "llm", should_continue, { "continue": "search", "end": END, }, ) # action 调用后返回 agent workflow.add_edge("search", "llm") graph = workflow.compile()

基于 LangGraph 与 Mem0 实现 AI Agent 的长期记忆与个性化体验