私有化大模型知识库部署指南
透过产品了解 RAG 技术原理,对未来大模型应用开发将起到事半功倍的效果。本文将对 RAG 技术原理进行总结,并详细演示如何基于 FastGPT 和 One-API 搭建私有化大模型知识库。
准备环境
- 操作系统:Linux 服务器(推荐),Windows 亦可(需安装 Docker Desktop)
- 容器环境:Docker 及 docker-compose 指令
- 模型账号:GPT 账号(如 Azure OpenAI),One-API 支持多类大模型账号接入
RAG 技术原理
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合检索与生成的技术。其核心流程为'检索 + 生成':
- 检索:利用向量数据库的高效存储和检索能力,召回与用户问题相关的知识片段。
- 生成:利用大语言模型(LLM)和 Prompt 工程,将召回的知识融入上下文,生成目标答案。
RAG 架构包含两个阶段:
- 数据准备阶段:将私域数据向量化后构建索引并存入数据库。
- 应用阶段:用户提问 → 数据检索(召回)→ 注入 Prompt → LLM 生成答案。

FastGPT 服务部署
FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。支持通过 Flow 可视化进行工作流编排,实现复杂的问答场景。这里采用 Docker Compose 方式部署开源版本。
1. 下载配置文件
mkdir fastgpt
cd fastgpt
curl -O https://raw.githubusercontent.com/labring/FastGPT/main/files/deploy/fastgpt/docker-compose.yml
curl -O https://raw.githubusercontent.com/labring/FastGPT/main/projects/app/data/config.json
2. 启动容器服务
在 docker-compose.yml 同级目录下执行以下命令。生产环境建议不要暴露数据库端口。
docker-compose pull
docker-compose up -d
配置说明:
pg: PostgreSQL 数据库,用于存储向量索引。mongo: MongoDB 数据库,用于存储业务数据。fastgpt: 主应用服务,依赖上述两个数据库。
修改 docker-compose.yml 中的环境变量以适配您的环境:
DEFAULT_ROOT_PSW: 设置 root 密码。OPENAI_BASE_URL: 填写中转地址(如使用官方号无需修改,务必加/v1)。CHAT_API_KEY: 填写 API Key。MONGODB_URI/ : 确保连接字符串正确。


