基于 LangChain+ChatGLM 部署本地私有化知识库 | 极客日志

PythonAI算法

基于 LangChain+ChatGLM 部署本地私有化知识库

利用 LangChain 框架结合 ChatGLM 大模型构建本地私有化知识库，涵盖环境搭建、数据向量化存储、检索增强生成（RAG）流程实现及容器化部署。方案重点解决数据安全、隐私保护及离线运行需求，通过向量数据库与提示词工程优化检索精度，为企业提供可控、安全且高效的智能问答解决方案。

技术博主发布于 2025/2/6更新于 2026/5/3126 浏览

基于 LangChain+ChatGLM 部署本地私有化知识库

前言

随着人工智能技术的快速发展，企业对数据安全和隐私保护的要求日益提高。构建本地私有化知识库不仅能集中管理海量信息，还能通过智能检索和推理功能，为用户提供准确、高效的知识服务。LangChain 作为强大的编排框架，结合 ChatGLM 等开源大模型，为部署本地私有化知识库提供了灵活且可控的技术方案。

技术架构概述

本方案采用检索增强生成（RAG）架构，主要包含以下核心组件：

大语言模型 (LLM)：使用 ChatGLM 系列模型，支持本地部署，具备优秀的中文理解与生成能力。
嵌入模型 (Embedding Model)：用于将文本转化为向量，如 bge-m3 或 m3e-base，确保语义匹配精度。
向量数据库：存储文档切片后的向量索引，推荐使用 ChromaDB 或 Milvus，支持快速相似度检索。
应用框架：基于 LangChain 实现链式调用，处理提示词工程、上下文管理及 API 接口封装。

环境搭建与依赖配置

1. 基础环境要求

Python 版本：>= 3.9
GPU 显存：建议 >= 8GB (若使用量化模型可降低要求)
操作系统：Linux / macOS / Windows

2. 安装依赖

创建虚拟环境并安装核心库：

python -m venv rag_env
source rag_env/bin/activate  # Linux/Mac
# 或
rag_env\Scripts\activate     # Windows

pip install langchain langchain-community transformers torch accelerate
pip install chromadb sentence-transformers streamlit

核心代码实现

1. 初始化模型加载

使用 HuggingFace Transformers 加载本地 ChatGLM 模型及 Embedding 模型。

from langchain.llms import HuggingFacePipeline
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import torch

model_name = "THUDM/chatglm3-6b"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map="auto",
    trust_remote_code=True
).half()

pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_new_tokens=512,
    do_sample=,
    temperature=
)

llm = HuggingFacePipeline(pipeline=pipe)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from langchain.document_loaders import DirectoryLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import Chroma

loader = DirectoryLoader('./data', glob="*.pdf")
docs = loader.load()

splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
splits = splitter.split_documents(docs)

embeddings = HuggingFaceEmbeddings(model_name="BAAI/bge-large-zh-v1.5")
vectorstore = Chroma.from_documents(documents=splits, embedding=embeddings)

from langchain.chains import RetrievalQA

qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=vectorstore.as_retriever(search_kwargs={"k": 3}),
    return_source_documents=True
)

response = qa_chain.run("请总结本文档中关于安全合规的内容")
print(response)

FROM python:3.9-slim
WORKDIR /app
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt
COPY . .
CMD ["streamlit", "run", "app.py"]

docker run -d --gpus all -p 8501:8501 -v ./data:/app/data my-rag-app:latest

基于 LangChain+ChatGLM 部署本地私有化知识库

基于 LangChain+ChatGLM 部署本地私有化知识库

前言

技术架构概述

环境搭建与依赖配置

1. 基础环境要求

2. 安装依赖

核心代码实现

1. 初始化模型加载

更多推荐文章

相关免费在线工具

2. 文档加载与向量化

3. 构建检索问答链

容器化部署方案

安全与优化策略

1. 数据安全

2. 性能优化

总结与展望

更多推荐文章

相关免费在线工具

基于 LangChain+ChatGLM 部署本地私有化知识库

基于 LangChain+ChatGLM 部署本地私有化知识库

前言

技术架构概述

环境搭建与依赖配置

1. 基础环境要求

2. 安装依赖

核心代码实现

1. 初始化模型加载

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 文档加载与向量化

3. 构建检索问答链

容器化部署方案

安全与优化策略

1. 数据安全

2. 性能优化

总结与展望

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具