基于 LangChain 为 LLM 添加记忆能力

最近两年，我们见识了'百模大战'，领略到了大型语言模型（LLM）的风采，但它们也存在一个显著的缺陷：没有记忆。

在对话中，无法记住上下文的 LLM 常常会让用户感到困扰。本文探讨如何利用 LangChain，快速为 LLM 添加记忆能力，提升对话体验。

1. LLM 固有缺陷：没有记忆

当前的 LLM 非常智能，在理解和生成自然语言方面表现优异，但是有一个显著的缺陷：没有记忆。

LLM 的本质是基于统计和概率来生成文本，对于每次请求，它们都将上下文视为独立事件。这意味着当你与 LLM 进行对话时，它不会记住你之前说过的话，这就导致了 LLM 有时表现得不够智能。

这种'无记忆'属性使得 LLM 无法在长期对话中有效跟踪上下文，也无法积累历史信息。比如，当你在聊天过程中提到一个人名，后续再次提及该人时，LLM 可能会忘记你之前的描述。

本着发现问题解决问题的原则，既然没有记忆，那就给 LLM 装上记忆吧。

2. 记忆组件的原理

2.1. 没有记忆的烦恼

当我们与 LLM 聊天时，它们无法记住上下文信息，导致回答缺乏连贯性。

2.2. 原理

如果将已有信息放入到 memory 中，每次跟 LLM 对话时，把已有的信息传入 LLM，那么 LLM 就能够正确回答。目前业内解决 LLM 记忆问题就是采用了类似的方案，即：将每次的对话记录再次注入到 Prompt 里，这样 LLM 每次对话时，就拥有了之前的历史对话信息。

但如果每次对话，都需要自己手动将本次对话信息继续加入到 history 信息中，那未免太繁琐。有没有轻松一些的方式呢？有，LangChain！LangChain 对记忆组件做了高度封装，开箱即用。

2.3. 长期记忆和短期记忆

在解决 LLM 的记忆问题时，有两种记忆方案：

短期记忆：基于内存的存储，容量有限，用于存储临时对话内容。会话结束或服务器重启后，数据会丢失。
长期记忆：基于硬盘或者外部数据库等方式，容量较大，用于存储需要持久的信息。支持跨会话的数据保留。

3. LangChain 让 LLM 记住上下文

LangChain 提供了灵活的内存组件工具来帮助开发者为 LLM 添加记忆能力。

3.1. 单独用 ConversationBufferMemory 做短期记忆

LangChain 提供了 ConversationBufferMemory 类，可以用来存储和管理对话。

ConversationBufferMemory 包含 input 变量和 output 变量，input 代表人类输入，output 代表 AI 输出。每次往 ConversationBufferMemory 组件里存入对话信息时，都会存储到 history 的变量里。

3.2. 利用 MessagesPlaceholder 手动添加 history

from langchain.memory import ConversationBufferMemory
 langchain.prompts  ChatPromptTemplate, MessagesPlaceholder





memory = ConversationBufferMemory(return_messages=)
memory.load_memory_variables({})

memory.save_context({: }, {: })
memory.load_memory_variables({})

memory.save_context({: }, {: })
memory.load_memory_variables({})

prompt = ChatPromptTemplate.from_messages(
    [
        (, ),
        MessagesPlaceholder(variable_name=),
        (, ),
    ]
)
chain = prompt | model

user_input = 
history = memory.load_memory_variables({})[]

res = chain.invoke({: user_input, : history})
(res.content)

user_input = 
res = chain.invoke({: user_input, : history})
memory.save_context({: user_input}, {: res.content})

res = chain.invoke({: , : history})
(res.content)

基于 LangChain 为 LLM 添加记忆能力