基于大语言模型搭建私有化知识库

拥有独立的大语言模型后，可以通过私有化改造将其转化为专属的个人助理。本文重点介绍如何结合 LangChain 框架打造个人知识库，实现基于特定文档的智能问答。

环境准备与前提

本教程基于阿里云 PAI（Platform for AI）交互式建模环境。在开始之前，请确保已完成基础大语言模型的部署（如 ChatGLM2-6B），并具备基本的 Linux 终端操作能力。若环境超过 15 天未登录，可能会被回收，需重新安装依赖。

1. 登录阿里云 PAI

登录阿里云控制台，搜索并进入【PAI】产品。
点击【交互式建模】，启动上一阶段已配置好的实例。
进入实例详情，新建一个 Terminal 终端窗口。

启动交互式建模

进入产品控制台

启动实例

项目部署

上传源代码

切换到【Notebook】界面。为了便于管理，建议将旧版 langchain-ChatGLM 的源代码打包成压缩包后上传至服务器，再统一解压。

切换 Notebook

上传压缩包

解压与初始化

回到【Terminal】，首先安装解压工具 p7zip-full：

sudo apt-get install p7zip-full

执行解压命令：

7z x langchain-ChatGLM.7z

解压完成后，进入项目目录：

cd langchain-ChatGLM

从 HuggingFace 克隆中文向量处理模型（首次克隆失败可重试）：

git clone https://huggingface.co/GanyMedeNil/text2vec-large-chinese

安装依赖

确保当前路径在项目根目录下，安装 Python 依赖包：

pip install -r requirements.txt

注意：如果环境被回收，需重新执行此步骤。

配置文件修改

1. 设置向量模型路径

切换到【Notebook】，找到 config/model_config.py 文件并打开。将 text2vec 的路径修改为相对路径：

text2vec-large-chinese

此处使用相对路径是因为后续将在 langchain-ChatGLM 目录下启动服务，该路径表示向量模型文件夹位于项目子目录中。

修改 text2vec 路径

2. 设置大模型路径

继续修改配置文件，指定本地部署的大模型路径。例如：

../ChatGLM2-6B/model

确认大模型名称配置正确，通常为 chatglm2-6b。

修改大模型路径

确认模型名称

启动服务

完成上述配置后，确认当前路径为 langchain-ChatGLM，运行启动脚本：

python webui.py

程序将自动下载资源并启动 WebUI 服务。等待进度条走完，看到启动成功的提示界面。

启动进度条

启动成功界面

系统会自动生成访问链接，点击即可在浏览器中打开 Web 界面。

访问链接

Web 界面

知识库问答体验

1. 无知识库模式对比

默认情况下，系统处于纯 LLM 对话模式。尝试提问专业领域问题，例如："建筑工程的四个抗震设防类别是什么？"

此时模型可能基于通用训练数据回答，存在幻觉风险，准确性无法保证。

LLM 模式回答

2. 加载知识库

切换对话模式为【知识库问答】。
在下拉菜单中选择或创建知识库（如 samples）。
界面会出现文件上传区域，支持 .txt, .pdf, .md 等格式。

切换知识库模式

上传知识文件

将准备好的专业文档（如抗震设防分类标准）拖入上传区，点击【上传文件并加载知识库】。

文件内容示例

加载提示

解析成功后，系统会提示内容已添加。

解析完成

3. 有知识库模式验证

再次询问同样的问题。此时系统会检索知识库中的相关内容，回答准确率显著提升，并能提供答案出处引用。

知识库模式回答

准确回答及出处

常见问题与优化

1. 端口占用问题

如果启动时提示端口已被占用，可修改 webui.py 中的端口号，或在启动命令中添加参数指定端口。

2. 显存不足

若遇到 OOM（Out Of Memory）错误，请检查 GPU 显存是否充足。对于 6B 参数量的模型，建议至少配备 12GB 以上显存。可尝试降低并发数或使用量化版本模型。

3. 向量检索效果不佳

若检索结果不相关，可调整切片大小（Chunk Size）和重叠率（Overlap）。在 config/model_config.py 中可配置分块策略，通常建议根据文档类型调整分块长度。

4. 多轮对话上下文

系统默认支持一定长度的上下文记忆。如需更长的历史对话记录，可在配置文件中调整 max_history 参数。

总结

通过上述步骤，我们成功在云端环境中搭建了基于 LangChain 和 ChatGLM 的私有化知识库。相比通用大模型，引入 RAG（检索增强生成）技术后，模型能够基于企业或个人私有数据进行精准回答，有效降低了幻觉概率，提升了专业领域的可用性。用户可根据实际需求持续上传更多文档，不断丰富知识库内容。