使用 Langchain-Chatchat 构建本地专属 GPT 助手
引言
随着大语言模型(LLM)技术的快速发展,如何安全、高效地利用私有数据成为企业和个人用户关注的焦点。将数据上传至公有云 API 存在隐私泄露风险,因此部署本地化的 AI 应用显得尤为重要。
Langchain-Chatchat 是一个基于 Langchain 框架与大语言模型结合的开源项目,支持本地知识库问答、文件对话及搜索引擎等功能。通过自行部署,用户可以完全掌控数据流向,确保信息安全。本文将详细介绍如何在 Linux 环境下从零开始搭建并运行 Langchain-Chatchat。
项目背景与功能
Langchain-Chatchat 目前拥有大量社区贡献者,是一个成熟的 RAG(检索增强生成)解决方案。其核心功能包括:
- LLM 对话:直接与大模型进行多轮交互。
- 知识库问答:基于上传的文档内容回答问题,引用来源清晰。
- 文件对话:类似 ChatPDF 的功能,解析上传的文件内容。
- 搜索引擎问答:结合实时网络搜索能力。
- 自定义 Agent:支持扩展智能体任务。
环境准备
1. 系统要求
建议配置如下:
- 操作系统:Linux (Ubuntu/CentOS) 或 macOS
- Python 版本:3.8 及以上
- 硬件:推荐使用 NVIDIA GPU(CUDA 环境),若仅 CPU 推理需调整模型参数
2. 获取项目代码
克隆官方仓库到本地服务器:
git clone https://github.com/chatchat-space/Langchain-Chatchat.git
cd Langchain-Chatchat
若无法访问 GitHub,可下载源码压缩包解压至指定目录。
3. 依赖安装
进入项目根目录,创建虚拟环境并安装依赖:
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
注意:部分依赖可能需要编译,请确保已安装 gcc 和 g++。
模型下载与配置
1. 大语言模型 (LLM)
本项目推荐选用 Qwen 系列模型。以 Qwen/Qwen-1_8B-Chat 为例,通过 HuggingFace 镜像站下载:
export HF_ENDPOINT=https://hf-mirror.com
使用 Python 脚本下载模型权重:
from huggingface_hub import snapshot_download
snapshot_download(
repo_id='Qwen/Qwen-1_8B-Chat',
repo_type='model',
local_dir='./Qwen/Qwen-1_8B-Chat',
resume_download=True
)
下载完成后,记录模型的绝对路径。


