LangChain 大模型对话记忆模块实战与 Web 应用 | 极客日志

Python

LangChain 大模型对话记忆模块实战与 Web 应用

LangChain 大模型对话记忆模块实战与 Web 应用目录前言：为什么需要对话记忆？一、核心认知：原始 API vs LangChain 封装 1.1 原生 API 调用的痛点（无记忆） 1.2 LangChain 的价值：封装记忆与简化调用二、LangChain 记忆模块核心组件 2.1 基础款：ConversationBufferMemory（完整记忆） 2.2 进阶款：窗口记忆与…

KernelLab发布于 2026/4/6更新于 2026/7/2167K 浏览

LangChain 大模型对话记忆模块实战与 Web 应用

前言：为什么需要对话记忆？
[一、核心认知：原始 API vs LangChain 封装](#一、核心认知：原始 API vs LangChain 封装)
- [1.1 原生 API 调用的痛点（无记忆）](#1.1 原生 API 调用的痛点无记忆)
- [1.2 LangChain 的价值：封装记忆与简化调用](#1.2 LangChain 的价值封装记忆与简化调用)
[二、LangChain 记忆模块核心组件](#二、LangChain 记忆模块核心组件)
- [2.1 基础款：ConversationBufferMemory（完整记忆）](#2.1 基础款 ConversationBufferMemory 完整记忆)
- [2.2 进阶款：窗口记忆与总结记忆](#2.2 进阶款窗口记忆与总结记忆)
  - [（1）ConversationBufferWindowMemory（窗口记忆）](#1 ConversationBufferWindowMemory 窗口记忆)
  - [（2）ConversationSummaryMemory（总结记忆）](#2 ConversationSummaryMemory 总结记忆)
[三、实战 1：LangChain 记忆链（ConversationChain）](#三、实战 1 LangChain 记忆链 ConversationChain)
[四、实战 2：Streamlit 搭建带记忆的聊天 Web 应用](#四、实战 2 Streamlit 搭建带记忆的聊天 Web 应用)
- [4.1 项目结构](#4.1 项目结构)
- [4.2 后端逻辑（scripts.py）](#4.2 后端逻辑 scriptspy)
- [4.3 前端逻辑（app.py）](#4.3 前端逻辑 apppy)
- [4.4 运行应用](#4.4 运行应用)
[五、学习总结 & 避坑指南](#五、学习总结避坑指南)
- [5.1 核心知识点总结](#5.1 核心知识点总结)
- [5.2 避坑指南](#5.2 避坑指南)
最后

前言：为什么需要对话记忆？

日常使用豆包、ChatGPT 等 AI 应用时，我们习以为常的「上下文记忆」功能（比如问完'林俊杰是谁'再问'他的代表作'，AI 能精准理解），其实并非大模型原生自带。直接调用大模型 API 时，每次请求都是独立的，模型只会基于当前输入的 Token 逐个预测回复，完全没有'记忆'能力，返回的也是包含原始格式的完整响应。

LangChain 作为大模型应用开发的核心框架，已经帮我们封装了对话记忆、Prompt 模板、链式调用等高频功能，无需手动解析原始 API 的复杂输出，也不用自己拼接上下文。

一、核心认知：原始 API vs LangChain 封装

1.1 原生 API 调用的痛点（无记忆）

直接调用大模型 API（即使是通义千问等兼容 OpenAI 接口的模型），每次请求都是'一次性'的，模型无法关联历史对话：

from openai import OpenAI
import os

# 初始化客户端（对接阿里云通义千问）
client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

# 第一次提问：林俊杰是谁
completion1 = client.chat.completions.create(
    model="qwen3.5-plus",
    messages=[{: , : }]
)
(, completion1.choices[].message.content)


completion2 = client.chat.completions.create(
    model=,
    messages=[{: , : }]
)
(, completion2.choices[].message.content)

相关免费在线工具

curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online

记忆类型	核心逻辑	适用场景
`ConversationBufferMemory`	保存所有对话历史，无长度限制	短对话、需要完整上下文的场景
`ConversationBufferWindowMemory`	只保存最近 `k` 轮对话	只需要短期记忆、节省 Token 的场景
`ConversationSummaryMemory`	将对话历史总结成文本	长对话、需要压缩上下文的场景
`ConversationSummaryBufferMemory`	短对话保留原文，超长部分总结	兼顾细节和长度的长对话场景
`ConversationTokenBufferMemory`	按 Token 数限制对话长度	严格控制上下文 Token 消耗的场景

from langchain.memory import ConversationBufferMemory

# 初始化记忆（return_messages=True：以消息对象存储，更易复用）
memory = ConversationBufferMemory(return_messages=True)

# 保存第一轮对话
memory.save_context({"input": "我的名字是陆天宇"}, {"output": "你好，陆天宇！"})

# 保存第二轮对话
memory.save_context({"input": "我是 AI 开发者"}, {"output": "太酷了！我们是同行～"})

# 加载记忆（查看历史对话）
print("记忆中的历史对话：")
print(memory.load_memory_variables({}))

记忆中的历史对话： {'history': [HumanMessage(content='我的名字是陆天宇'), AIMessage(content='你好，陆天宇！'), HumanMessage(content='我是 AI 开发者'), AIMessage(content='太酷了！我们是同行～')]}

from langchain.memory import ConversationBufferWindowMemory

# k=1：只保留最近 1 轮对话
memory = ConversationBufferWindowMemory(k=1, return_messages=True)
memory.save_context({"input": "名字是陆天宇"}, {"output": "你好"})
memory.save_context({"input": "是 AI 开发者"}, {"output": "同行"})

# 加载记忆（仅保留最后 1 轮）
print(memory.load_memory_variables({}))
# 输出：{'history': [HumanMessage(content='是 AI 开发者'), AIMessage(content='同行')]}

from langchain.memory import ConversationSummaryMemory
from langchain_openai import ChatOpenAI
import os

# 初始化模型（用于总结对话）
model = ChatOpenAI(
    model="qwen3.5-plus",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    openai_api_base="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

# 初始化总结记忆
memory = ConversationSummaryMemory(llm=model, return_messages=True)
memory.save_context({"input": "名字是陆天宇，是 AI 开发者，专注 NLP 方向"}, {"output": "记住了你的信息～"})

# 加载记忆（已自动总结）
print(memory.load_memory_variables({}))
# 输出：{'history': [SystemMessage(content='陆天宇介绍自己是专注 NLP 方向的 AI 开发者，AI 表示记住了相关信息。')]}

from langchain.chains import ConversationChain
from langchain_openai import ChatOpenAI
from langchain.memory import ConversationBufferMemory
import os

# 1. 初始化模型
model = ChatOpenAI(
    model="qwen3.5-plus",
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    openai_api_base="https://dashscope.aliyuncs.com/compatible-mode/v1"
)

# 2. 初始化记忆
memory = ConversationBufferMemory(return_messages=True)

# 3. 创建记忆链（自动关联模型和记忆）
chain = ConversationChain(llm=model, memory=memory)

# 4. 第一轮对话
resp1 = chain.invoke({"input": "我的名字是陆天宇"})
print("AI 回复 1：", resp1["response"])

# 5. 第二轮对话（带上下文）
resp2 = chain.invoke({"input": "你知道我的名字吗？"})
print("AI 回复 2：", resp2["response"])

AI 回复 1： 你好，陆天宇！很高兴认识你～
AI 回复 2： 当然知道啦，你的名字是陆天宇呀 😊

chat-app/
├── app.py          # 前端页面逻辑
└── scripts.py      # 后端模型调用逻辑

from langchain.chains import ConversationChain
from langchain_openai import ChatOpenAI

def get_chat_response(prompt, memory, api_key):
    # 初始化模型
    model = ChatOpenAI(
        model="qwen3.5-plus",
        openai_api_key=api_key,
        openai_api_base="https://dashscope.aliyuncs.com/compatible-mode/v1"
    )
    # 创建记忆链
    chain = ConversationChain(llm=model, memory=memory)
    # 调用模型
    response = chain.invoke({"input": prompt})
    return response["response"]

import streamlit as st
from langchain.memory import ConversationBufferMemory
from scripts import get_chat_response

# 页面配置
st.title("💬 带记忆的 AI 聊天助手")
st.sidebar.title("配置")
api_key = st.sidebar.text_input("阿里云 API Key", type="password")

# 初始化会话状态（保存记忆和消息）
if "memory" not in st.session_state:
    st.session_state["memory"] = ConversationBufferMemory(return_messages=True)
    st.session_state["messages"] = [{"role": "ai", "content": "你好，我是你的 AI 助手～"}]

# 渲染历史消息
for msg in st.session_state["messages"]:
    st.chat_message(msg["role"]).write(msg["content"])

# 处理用户输入
prompt = st.chat_input("请输入你的问题...")
if prompt:
    if not api_key:
        st.warning("请先输入 API Key！")
        st.stop()
    
    # 添加用户消息
    st.session_state["messages"].append({"role": "human", "content": prompt})
    st.chat_message("human").write(prompt)
    
    # 调用 AI 回复
    with st.spinner("AI 思考中..."):
        response = get_chat_response(prompt, st.session_state["memory"], api_key)
        
    # 添加 AI 消息
    st.session_state["messages"].append({"role": "ai", "content": response})
    st.chat_message("ai").write(response)

# 安装依赖
pip install streamlit langchain langchain-openai

# 运行应用
streamlit run app.py

LangChain 大模型对话记忆模块实战与 Web 应用

LangChain 大模型对话记忆模块实战与 Web 应用

目录

前言：为什么需要对话记忆？

一、核心认知：原始 API vs LangChain 封装

1.1 原生 API 调用的痛点（无记忆）

更多推荐文章

相关免费在线工具

1.2 LangChain 的价值：封装记忆与简化调用

二、LangChain 记忆模块核心组件

2.1 基础款：ConversationBufferMemory（完整记忆）

2.2 进阶款：窗口记忆与总结记忆

（1）ConversationBufferWindowMemory（窗口记忆）

（2）ConversationSummaryMemory（总结记忆）

三、实战 1：LangChain 记忆链（ConversationChain）

四、实战 2：Streamlit 搭建带记忆的聊天 Web 应用

4.1 项目结构

4.2 后端逻辑（scripts.py）

4.3 前端逻辑（app.py）

4.4 运行应用

五、学习总结 & 避坑指南

5.1 核心知识点总结

5.2 避坑指南

最后

更多推荐文章

相关免费在线工具

LangChain 大模型对话记忆模块实战与 Web 应用

LangChain 大模型对话记忆模块实战与 Web 应用

目录

前言：为什么需要对话记忆？

一、核心认知：原始 API vs LangChain 封装

1.1 原生 API 调用的痛点（无记忆）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.2 LangChain 的价值：封装记忆与简化调用

二、LangChain 记忆模块核心组件

2.1 基础款：ConversationBufferMemory（完整记忆）

2.2 进阶款：窗口记忆与总结记忆

（1）ConversationBufferWindowMemory（窗口记忆）

（2）ConversationSummaryMemory（总结记忆）

三、实战 1：LangChain 记忆链（ConversationChain）

四、实战 2：Streamlit 搭建带记忆的聊天 Web 应用

4.1 项目结构

4.2 后端逻辑（scripts.py）

4.3 前端逻辑（app.py）

4.4 运行应用

五、学习总结 & 避坑指南

5.1 核心知识点总结

5.2 避坑指南

最后

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具