基于 Langchain-Chatchat 快速构建本地 LLM 智能知识库 | 极客日志

PythonAI算法

基于 Langchain-Chatchat 快速构建本地 LLM 智能知识库

介绍开源项目 Langchain-Chatchat，这是一个基于 Langchain 和大语言模型（LLM）的检索增强生成（RAG）知识库解决方案。支持离线私有部署，兼容多种开源模型及 Embedding 模型。文章涵盖项目原理、软硬件部署要求、Docker 与本地部署步骤、Lite 模式配置以及常见问题排查，旨在帮助开发者快速搭建本地化的智能问答系统。内容包含详细的命令操作、配置优化建议及故障处理方法，适合有 Python 基础的技术人员阅读。

ArchDesign发布于 2025/2/6更新于 2026/6/125 浏览

基于 Langchain-Chatchat 快速构建本地 LLM 智能知识库

简介

Langchain-Chatchat 是一个开源、可离线部署的检索增强生成 (RAG) 大模型知识库项目。它基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现，旨在建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

本项目利用 Langchain 思想实现基于本地知识库的问答应用。目前 Langchain 可以说是开发 LLM 应用的首选框架。依托于本项目支持的开源 LLM 与 Embedding 模型，可实现全部使用开源模型进行离线私有部署。同时，项目也支持 OpenAI GPT API 的调用，并将在后续持续扩充对各类模型及模型 API 的接入。

实现原理

本项目全流程使用开源模型来实现本地知识库问答应用。最新版本中通过使用 FastChat 接入 Vicuna, Alpaca, LLaMA, Koala, RWKV 等模型。依托于 Langchain 框架，支持通过基于 FastAPI 提供的 API 调用服务，或使用基于 Streamlit 的 WebUI 进行操作。

文档处理流程

从文档处理角度来看，实现流程主要包括以下步骤：

数据加载：读取本地文件（PDF, TXT, Markdown 等）。
文本分割：将长文本按策略切分为适合模型处理的片段。
向量化：使用 Embedding 模型将文本片段转换为向量。
存储：将向量存入向量数据库（如 FAISS, Milvus 等）。
检索与生成：用户提问时，检索相关向量片段，结合 Prompt 发送给 LLM 生成回答。

需要注意的是，本项目未涉及微调、训练过程，但可利用微调或训练对本项目效果进行优化。

部署要求

软件要求

操作系统：推荐 Linux Ubuntu 22.04.5 kernel version 6.7。其他系统可能出现兼容性问题。
Python 版本：>= 3.8 (< 3.12)。推荐使用 Python 3.11.7 以获得最佳稳定性。
CUDA 版本：>= 12.1。若使用轻量模式在线运行，则不需要安装 torch 等库。

硬件要求

如果想要顺利在 GPU 运行本地模型的 FP16 版本，建议参考以下配置以保证稳定连续对话：

模型类型	最低显存要求	推荐显卡
ChatGLM3-6B / LLaMA-7B-Chat	14GB	RTX 4080
Qwen-14B-Chat	30GB	V100
Yi-34B-Chat	69GB	A100
Qwen-72B-Chat	145GB	多卡 A100 以上

实际部署配置示例：

处理器：Intel® Core™ i9 processor 14900K 
内存：256 GB DDR5
显卡组：NVIDIA RTX4090 X  / NVIDIA RTXA6000  
硬盘： TB
操作系统：Ubuntu  LTS / Arch Linux, Linux Kernel .
显卡驱动版本：.
Cuda 版本： Update 
Python 版本：.

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

docker run -d --gpus all -p 80:8501 isafetech/chatchat:0.2.10
docker run -d --gpus all -p 80:8501 ccr.ccs.tencentyun.com/chatchat/chatchat:0.2.10
docker run -d --gpus all -p 80:8501 registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.10

# 首先，确信你的机器安装了 Python 3.8 - 3.10 版本
$ python --version
Python 3.8.13

# 创建 conda 环境
$ conda create -p /your_path/env_name python=3.8
$ source activate /your_path/env_name
# 或者
$ conda create -n env_name python=3.8
$ conda activate env_name

# 更新 pip 库
$ pip3 install --upgrade pip

# 拉取仓库
$ git clone --recursive https://github.com/chatchat-space/Langchain-Chatchat.git
# 进入目录
$ cd Langchain-Chatchat
# 安装全部依赖
$ pip install -r requirements.txt

$ git lfs install
$ git clone https://huggingface.co/THUDM/chatglm2-6b
$ git clone https://huggingface.co/moka-ai/m3e-base

# 如果您已经有创建过知识库
$ python init_database.py --create-tables
# 如果您是第一次运行本项目
$ python init_database.py --recreate-vs

$ python startup.py -a

$ pip install -r requirements_lite.txt
$ python startup.py -a --lite

# model_config.py 示例
LLM_MODELS = {
    "qwen-chat": {
        "path": "./models/qwen-7b-chat",
        "model_type": "llama"
    }
}

# 启用 Milvus 支持
pip install pymilvus
# 修改 config 设置 vector_store_type: milvus

基于 Langchain-Chatchat 快速构建本地 LLM 智能知识库

基于 Langchain-Chatchat 快速构建本地 LLM 智能知识库

简介

实现原理

文档处理流程

部署要求

软件要求

硬件要求

更多推荐文章

相关免费在线工具

部署方案

Docker 部署

本地部署方案

1. 安装 Python 环境

2. 安装项目依赖

3. 下载模型

4. 初始化数据库

5. 启动服务

Lite 模式（无显卡模式）

使用指南

高级配置与优化

自定义模型配置

向量数据库选择

性能调优

常见问题排查

总结

更多推荐文章

相关免费在线工具

基于 Langchain-Chatchat 快速构建本地 LLM 智能知识库

基于 Langchain-Chatchat 快速构建本地 LLM 智能知识库

简介

实现原理

文档处理流程

部署要求

软件要求

硬件要求

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

部署方案

Docker 部署

本地部署方案

1. 安装 Python 环境

2. 安装项目依赖

3. 下载模型

4. 初始化数据库

5. 启动服务

Lite 模式（无显卡模式）

使用指南

高级配置与优化

自定义模型配置

向量数据库选择

性能调优

常见问题排查

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具