使用 Llama3 与 MaxKB 搭建本地私有 AI 知识库
背景与方案概述
在业务场景中,销售人员或客服团队往往面临产品知识繁杂、技术参数复杂的问题。传统的培训方式效率低且难以随时查阅。利用本地部署的大语言模型构建私有 AI 知识库,可以实现零成本的知识问答系统。
本方案采用开源工具组合:
- Ollama:提供本地免费大模型推理接口。
- MaxKB:基于 LangChain 的开源知识库问答系统,提供前端 UI 和管理后台。
- Llama3:Meta 发布的开源大模型,支持中文,适合本地运行。
该方案完全利用本地资源,数据不出内网,无需支付 API 费用,并可嵌入公司网站或小程序。
环境准备
硬件要求
- CPU:建议 8 核以上。
- 内存:至少 16GB(推荐 32GB),用于加载模型和向量数据库。
- 显卡:NVIDIA GPU 更佳(显存 8GB+),若仅用 CPU 则需更多内存。
- 磁盘:预留 50GB 以上空间存储模型和向量索引。
软件依赖
- Docker Engine 20.10+
- Docker Compose
- 操作系统:Linux (Ubuntu/CentOS) 或 macOS/Windows WSL
第一步:安装 Ollama
Ollama 是本地运行大模型的轻量级服务。
- 访问官网下载对应系统的安装包:https://ollama.com/download
- 双击安装或使用包管理器安装。
- 验证安装是否成功,打开终端输入:
ollama --version
- 拉取并运行 Llama3 模型:
ollama run llama3
首次运行会自动下载模型文件,等待进度条完成即可。模型默认量化版本约为 4GB 大小,适合消费级硬件。
第二步:部署 MaxKB
MaxKB 是一个容器化的知识库应用,通过 Docker 快速部署。
- 确保 Docker 服务已启动。
- 执行以下命令启动 MaxKB 容器:
docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data 1panel/maxkb
-p 8080:8080:映射 Web 访问端口。-v ~/.maxkb:/var/lib/postgresql/data:持久化数据库数据。
- 部署成功后,在浏览器访问:http://127.0.0.1:8080
第三步:配置大模型连接
登录 MaxKB 管理后台后,需配置后端模型连接。
- 默认账号密码为
admin/MaxKB@123..,首次登录请修改密码。 - 进入设置页面,找到'大模型配置'模块。
- 新建模型配置:
- 模型名称:自定义,例如
Local-Llama3。
- 模型名称:自定义,例如


