基于 LangChain 和 ChatGLM 的本地知识库问答系统搭建 | 极客日志

PythonAI算法

基于 LangChain 和 ChatGLM 的本地知识库问答系统搭建

介绍利用 LangChain 框架结合 ChatGLM 大模型构建私有化本地知识库问答系统的完整方案。内容涵盖环境准备、文本数据加载与切分策略、Embedding 生成方式对比（OpenAI 与 HuggingFace）、向量数据库选型（Chroma 与 FAISS）以及检索增强生成链路的实现细节。通过本地部署模型，有效避免调用外部 API，保障数据安全并降低长期成本。文中提供详细的代码示例与参数配置说明，辅助开发者快速掌握基于大模型的智能问答应用开发流程。

宁静发布于 2025/2/7更新于 2026/7/2336 浏览

基于 LangChain 和 ChatGLM 的本地知识库问答系统搭建

最近有看到可以利用 LangChain + OpenAI 的 API 来实现一个问答系统。既然可以将 ChatGLM 集成进 LangChain，是不是我们可以在完全不使用 OpenAI 的情况下来实现一个私有化的本地知识库问答系统的搭建呢？本文将介绍一种可行的方案。

环境准备

在开始之前，请确保已安装以下依赖库：

pip install langchain langchain-community chromadb sentence-transformers transformers torch

步骤详解

1. ChatGLM 集成进 LangChain

首先需要将 ChatGLM 模型加载到 LangChain 中。通常可以通过 HuggingFacePipeline 或特定的 LangChain 适配器来实现。这里假设已经封装好了对应的接口。

2. 生成 Embedding

本文使用一篇公开的新闻数据来做测试。

切分文本

参照 Text Splitters 文档，可以选择对应的文本切分器。如果是通用文本的话，建议选择 RecursiveCharacterTextSplitter，代码如下：

from langchain.document_loaders import UnstructuredFileLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

# 导入文本
loader = UnstructuredFileLoader("./data/news_test.txt")
# 将文本转成 Document 对象
data = loader.load()
print(f'documents:{len(data)}')

# 初始化加载器
# chunk_size: 每一个分片的最大大小
# chunk_overlap: 相邻的块之间的最大重叠，有助于保持上下文连续性
text_splitter = RecursiveCharacterTextSplitter(chunk_size=100, chunk_overlap=0)
# 切割加载的 document
split_docs = text_splitter.split_documents(data)
print("split_docs size:", len(split_docs))

打印结果如下：

documents: 1
split_docs size: 31

chunk_size：每一个分片的最大大小，根据模型上下文窗口调整。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

直接使用 OpenAIEmbeddings 来生成 Embedding 数据

from langchain.embeddings.openai import OpenAIEmbeddings
import os
from dotenv import load_dotenv

load_dotenv()
os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")
# 如果希望通过代理来访问可以配置上
# os.environ["OPENAI_API_BASE"] = os.getenv("OPENAI_API_BASE")

embeddings = OpenAIEmbeddings()

使用 HuggingFaceEmbeddings 来生成 Embedding 数据

from langchain.embeddings.huggingface import HuggingFaceEmbeddings
import sentence_transformers

embedding_model_dict = {
    "ernie-tiny": "nghuyong/ernie-3.0-nano-zh",
    "ernie-base": "nghuyong/ernie-3.0-base-zh",
    "text2vec": "GanymedeNil/text2vec-large-chinese",
    "text2vec2": "uer/sbert-base-chinese-nli",
    "text2vec3": "shibing624/text2vec-base-chinese",
}

EMBEDDING_MODEL = "text2vec3"
# 初始化 huggingFace 的 embeddings 对象
embeddings = HuggingFaceEmbeddings(model_name=embedding_model_dict[EMBEDDING_MODEL])
embeddings.client = sentence_transformers.SentenceTransformer(
        embeddings.model_name, device='mps')

from langchain.vectorstores import Chroma

# 初始化加载器
db = Chroma.from_documents(split_docs, embeddings, persist_directory="./chroma/openai/news_test")
# 持久化
db.persist()

db = Chroma(persist_directory="./chroma/news_test", embedding_function=embeddings)

持久化

from langchain.vectorstores import FAISS

db = FAISS.from_documents(split_docs, embeddings)
db.save_local("./faiss/news_test")

加载已持久化向量

db = FAISS.load_local("./faiss/news_test", embeddings=embeddings)

如果只想使用 embedding 来计算句子的相似度，可以直接类似下面这样使用：

# 初始化 prompt 对象
question = "2022 年腾讯营收多少"

similarDocs = db.similarity_search(question, include_metadata=True, k=4)
[print(x) for x in similarDocs]

最多返回匹配的前 4 条相似度最高的句子

如果想接入 ChatGLM 来帮忙做总结和汇总的话，可以如下使用：

from langchain.chains import RetrievalQA

retriever = db.as_retriever()
# 注意：ChatGLM 类需根据实际集成的适配器进行初始化
qa = RetrievalQA.from_chain_type(llm=ChatGLM(temperature=0.1), chain_type="stuff", retriever=retriever)
# 进行问答
query = "2022 年腾讯营收多少"
print(qa.run(query))

基于 LangChain 和 ChatGLM 的本地知识库问答系统搭建

基于 LangChain 和 ChatGLM 的本地知识库问答系统搭建

环境准备

步骤详解

1. ChatGLM 集成进 LangChain

2. 生成 Embedding

切分文本

更多推荐文章

相关免费在线工具

生成 Embedding

保存 Embedding 数据

3. 试验效果

4. 优化建议与总结

更多推荐文章

相关免费在线工具

基于 LangChain 和 ChatGLM 的本地知识库问答系统搭建

基于 LangChain 和 ChatGLM 的本地知识库问答系统搭建

环境准备

步骤详解

1. ChatGLM 集成进 LangChain

2. 生成 Embedding

切分文本

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

生成 Embedding

保存 Embedding 数据

3. 试验效果

4. 优化建议与总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具