AI 长期记忆 8 种优化策略及 LangChain 代码实现 | 极客日志

PythonAI算法

AI 长期记忆 8 种优化策略及 LangChain 代码实现

综述由AI生成基于大模型 Agent 的 8 种长期记忆维护策略，包括 ConversationBufferMemory、WindowMemory、EntityMemory、KGMemory、SummaryMemory、SummaryBufferMemory、TokenBufferMemory 及 VectorStoreRetrieverMemory。通过客服、电商、法律、医疗等场景分析，结合 LangChain 代码示例，阐述了不同记忆机制在多轮对话中的适用性与实现方法，并提供了选型对比表，帮助开发者构建具备连贯性和上下文理解能力的智能体系统。

清心发布于 2025/2/7更新于 2026/6/325 浏览

AI 长期记忆的 8 种优化策略及 LangChain 代码实现

在基于大模型的 Agent 系统中，长期记忆的状态维护至关重要。根据 OpenAI AI 应用研究主管 Lilian Weng 在《基于大模型的 Agent 构成》中的观点，记忆被视为关键组件之一。本文将结合 LangChain 框架，详细解析 8 种不同的记忆维护方式及其在不同场景中的应用实例。

1. 获取全量历史对话 (ConversationBufferMemory)

适用场景：一般客服场景、短文本交互。

在电信公司的客服聊天机器人场景中，如果用户在对话中先是询问了账单问题，接着又谈到了网络连接问题，ConversationBufferMemory 可以用来记住整个与用户的对话历史。这有助于 AI 在回答网络问题时还记得账单问题的相关细节，从而提供更连贯的服务。

from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory()
memory.save_context({"input": "你好"}, {"output": "怎么了"})

variables = memory.load_memory_variables({})
print(variables)

优点：保留所有历史，上下文最完整。
缺点：随着对话轮数增加，Token 消耗会线性增长，可能导致超出模型上下文窗口限制。

2. 滑动窗口获取最近部分对话内容 (ConversationBufferWindowMemory)

适用场景：商品咨询场景、对时效性要求高的问答。

在一个电商平台上，如果用户询问关于特定产品的问题（如手机的电池续航时间），然后又问到了配送方式，ConversationBufferWindowMemory 可以帮助 AI 只专注于最近的一两个问题（如配送方式），而不是整个对话历史，以提供更快速和专注的答复。

from langchain.memory import ConversationBufferWindowMemory

# 只保留最后 2 次互动的记忆
memory = ConversationBufferWindowMemory(k=2)
memory.save_context({"input": "手机电池怎么样？"}, {"output": "续航很强"})
memory.save_context({"input": "怎么配送？"}, {"output": "次日达"})

variables = memory.load_memory_variables({})
print(variables)

优点：控制 Token 使用，关注近期上下文。
缺点：丢失了早期的重要信息，不适合需要长程关联的场景。

3. 获取历史对话中实体信息 (ConversationEntityMemory)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from langchain.memory import ConversationEntityMemory
from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(model="gpt-3.5-turbo", temperature=0)
memory = ConversationEntityMemory(llm=llm)
_input = {"input": "公众号《LLM 应用全栈开发》的作者是莫尔索"}
memory.load_memory_variables(_input)
memory.save_context(
    _input,
    {"output": "是吗，这个公众号是干嘛的"}
)
print(memory.load_memory_variables({"input": "莫尔索是谁？"}))

from langchain.memory import ConversationKGMemory
from langchain.llms import OpenAI

llm = OpenAI(temperature=0)
memory = ConversationKGMemory(llm=llm)
memory.save_context({"input": "小李是程序员"}, {"output": "知道了，小李是程序员"})
memory.save_context({"input": "莫尔索是小李的笔名"}, {"output": "明白，莫尔索是小李的笔名"})

variables = memory.load_memory_variables({"input": "告诉我关于小李的信息"})
print(variables)

from langchain.memory import ConversationSummaryMemory
from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(model="gpt-3.5-turbo")
memory = ConversationSummaryMemory(llm=llm)
memory.save_context({"input": "什么是变量？"}, {"output": "变量是存储数据的容器"})
memory.save_context({"input": "如何定义？"}, {"output": "使用 var 关键字"})

variables = memory.load_memory_variables({})
print(variables)

from langchain.memory import ConversationSummaryBufferMemory
from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(model="gpt-3.5-turbo")
memory = ConversationSummaryBufferMemory(llm=llm, max_token_limit=2000)
memory.save_context({"input": "系统报错"}, {"output": "检查日志"})
memory.save_context({"input": "日志为空"}, {"output": "重启服务"})

variables = memory.load_memory_variables({})
print(variables)

from langchain.memory import ConversationTokenBufferMemory
from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(model="gpt-3.5-turbo")
memory = ConversationTokenBufferMemory(llm=llm, max_token_limit=1000)
memory.save_context({"input": "股票 A 涨了"}, {"output": "关注基本面"})
memory.save_context({"input": "债券 B 跌了"}, {"output": "注意风险"})

variables = memory.load_memory_variables({})
print(variables)

from langchain.memory import VectorStoreRetrieverMemory
from langchain.vectorstores import Chroma
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import ConversationChain
from langchain.prompts import PromptTemplate

vectorstore = Chroma(embedding_function=OpenAIEmbeddings())
retriever = vectorstore.as_retriever(search_kwargs=dict(k=1))
memory = VectorStoreRetrieverMemory(retriever=retriever)

PROMPT_TEMPLATE = """以下是人类和 AI 之间的友好对话。AI 话语多且提供了许多来自其上下文的具体细节。如果 AI 不知道问题的答案，它会诚实地说不知道。

以前对话的相关片段：
{history}

（如果不相关，你不需要使用这些信息）

当前对话：
人类：{input}
AI：
"""

prompt = PromptTemplate(input_variables=["history", "input"], template=PROMPT_TEMPLATE)
conversation_with_summary = ConversationChain(
    llm=llm,
    prompt=prompt,
    memory=memory,
    verbose=True
)

print(conversation_with_summary.predict(input="你好，我是莫尔索，你叫什么"))
print(conversation_with_summary.predict(input="我喜欢的食物是什么？"))

记忆类型	适用场景	优缺点
ConversationBufferMemory	短对话、简单任务	完整但 Token 消耗快
ConversationBufferWindowMemory	近期关注、电商咨询	轻量但丢失历史信息
ConversationEntityMemory	个性化、法律/医疗	结构好但依赖抽取精度
ConversationKGMemory	复杂关系推理	推理强但构建慢
ConversationSummaryMemory	长对话、教育辅导	省 Token 但细节少
ConversationSummaryBufferMemory	技术支持、混合场景	平衡性好
ConversationTokenBufferMemory	金融、实时风控	严格控流但可能丢信息
VectorStoreRetrieverMemory	知识库、新闻检索	检索准但架构重

AI 长期记忆 8 种优化策略及 LangChain 代码实现

AI 长期记忆的 8 种优化策略及 LangChain 代码实现

1. 获取全量历史对话 (ConversationBufferMemory)

2. 滑动窗口获取最近部分对话内容 (ConversationBufferWindowMemory)

3. 获取历史对话中实体信息 (ConversationEntityMemory)

更多推荐文章

相关免费在线工具

4. 利用知识图谱获取历史对话中的实体及其联系 (ConversationKGMemory)

5. 对历史对话进行阶段性总结摘要 (ConversationSummaryMemory)

6. 需要获取最新对话，又要兼顾较早历史对话 (ConversationSummaryBufferMemory)

7. 回溯最近和最关键的对话信息 (ConversationTokenBufferMemory)

8. 基于向量检索对话信息 (VectorStoreRetrieverMemory)

总结与选型建议

更多推荐文章

相关免费在线工具

AI 长期记忆 8 种优化策略及 LangChain 代码实现

AI 长期记忆的 8 种优化策略及 LangChain 代码实现

1. 获取全量历史对话 (ConversationBufferMemory)

2. 滑动窗口获取最近部分对话内容 (ConversationBufferWindowMemory)

3. 获取历史对话中实体信息 (ConversationEntityMemory)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4. 利用知识图谱获取历史对话中的实体及其联系 (ConversationKGMemory)

5. 对历史对话进行阶段性总结摘要 (ConversationSummaryMemory)

6. 需要获取最新对话，又要兼顾较早历史对话 (ConversationSummaryBufferMemory)

7. 回溯最近和最关键的对话信息 (ConversationTokenBufferMemory)

8. 基于向量检索对话信息 (VectorStoreRetrieverMemory)

总结与选型建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具