私有化大模型知识库部署指南：FastGPT 与 One-API 实践 | 极客日志

Shell / BashAI算法

私有化大模型知识库部署指南：FastGPT 与 One-API 实践

基于 FastGPT 和 One-API 部署私有化大模型知识库的完整流程。涵盖 RAG 技术原理、Docker 环境准备、服务部署配置、向量模型接入及常见问题排查，旨在帮助开发者快速搭建本地化的智能问答系统。

GitMaster发布于 2025/2/6更新于 2026/6/121 浏览

私有化大模型知识库部署指南

透过产品了解 RAG 技术原理，对未来大模型应用开发将起到事半功倍的效果。本文将对 RAG 技术原理进行总结，并详细演示如何基于 FastGPT 和 One-API 搭建私有化大模型知识库。

准备环境

操作系统：Linux 服务器（推荐），Windows 亦可（需安装 Docker Desktop）
容器环境：Docker 及 docker-compose 指令
模型账号：GPT 账号（如 Azure OpenAI），One-API 支持多类大模型账号接入

RAG 技术原理

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合检索与生成的技术。其核心流程为'检索 + 生成'：

检索：利用向量数据库的高效存储和检索能力，召回与用户问题相关的知识片段。
生成：利用大语言模型（LLM）和 Prompt 工程，将召回的知识融入上下文，生成目标答案。

RAG 架构包含两个阶段：

数据准备阶段：将私域数据向量化后构建索引并存入数据库。
应用阶段：用户提问 → 数据检索（召回）→ 注入 Prompt → LLM 生成答案。

FastGPT 架构图

FastGPT 服务部署

FastGPT 是一个基于 LLM 大语言模型的知识库问答系统，提供开箱即用的数据处理、模型调用等能力。支持通过 Flow 可视化进行工作流编排，实现复杂的问答场景。这里采用 Docker Compose 方式部署开源版本。

1. 下载配置文件

mkdir fastgpt
cd fastgpt
curl -O https://raw.githubusercontent.com/labring/FastGPT/main/files/deploy/fastgpt/docker-compose.yml
curl -O https://raw.githubusercontent.com/labring/FastGPT/main/projects/app/data/config.json

2. 启动容器服务

在 docker-compose.yml 同级目录下执行以下命令。生产环境建议不要暴露数据库端口。

docker-compose pull
docker-compose up -d

配置说明：

pg: PostgreSQL 数据库，用于存储向量索引。
mongo: MongoDB 数据库，用于存储业务数据。
fastgpt: 主应用服务，依赖上述两个数据库。

修改 docker-compose.yml 中的环境变量以适配您的环境：

DEFAULT_ROOT_PSW: 设置 root 密码。
OPENAI_BASE_URL: 填写中转地址（如使用官方号无需修改，务必加 /v1）。
CHAT_API_KEY: 填写 API Key。
MONGODB_URI / : 确保连接字符串正确。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

PG_URL

version: '3.3'
services:
  pg:
    image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.5.0
    container_name: pg
    restart: always
    ports:
      - "5432:5432"
    environment:
      - POSTGRES_USER=username
      - POSTGRES_PASSWORD=password
      - POSTGRES_DB=postgres
    volumes:
      - ./pg/data:/var/lib/postgresql/data
  
  mongo:
    image: registry.cn-hangzhou.aliyuncs.com/fastgpt/mongo:5.0.18
    container_name: mongo
    restart: always
    ports:
      - "27017:27017"
    environment:
      - MONGO_INITDB_ROOT_USERNAME=username
      - MONGO_INITDB_ROOT_PASSWORD=password
    volumes:
      - ./mongo/data:/data/db

  fastgpt:
    container_name: fastgpt
    image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:latest
    ports:
      - "3000:3000"
    depends_on:
      - mongo
      - pg
    environment:
      - DEFAULT_ROOT_PSW=1234
      - OPENAI_BASE_URL=http://ip:端口/v1
      - CHAT_API_KEY=sk-xxxx
      - MONGODB_URI=mongodb://username:password@mongo:27017/fastgpt?authSource=admin
      - PG_URL=postgresql://username:password@pg:5432/postgres

mkdir /oneapi
cp docker-compose.yml /oneapi
cd /oneapi
docker-compose up -d

environment:
  - OPENAI_BASE_URL=http://your-ip:port/v1
  - CHAT_API_KEY=sk-xxxx

{
  "SystemParams": {
    "pluginBaseUrl": "",
    "vectorMaxProcess": 15,
    "qaMaxProcess": 15,
    "pgHNSWEfSearch": 100
  },
  "ChatModels": [
    {
      "model": "gpt-3.5-turbo",
      "name": "GPT35-turbo",
      "price": 0,
      "maxContext": 16000,
      "maxResponse": 4000,
      "quoteMaxToken": 2000,
      "maxTemperature": 1.2,
      "censor": false,
      "vision": false,
      "defaultSystemChatPrompt": ""
    }
  ],
  "VectorModels": [
    {
      "model": "text-embedding-ada-002",
      "name": "Embedding-2",
      "price": 0.0,
      "defaultToken": 700,
      "maxToken": 3000
    }
  ]
}

cd /fastgpt
docker-compose restart

version: '1'
services:
  m3e:
    image: registry.cn-hangzhou.aliyuncs.com/fastgpt_docker/m3e-large-api:latest
    restart: no
    ports:
      - "6008:6008"

"VectorModels": [
  {
    "model": "m3e",
    "name": "M3E（测试使用）",
    "price": 0.1,
    "defaultToken": 500,
    "maxToken": 1800
  }
]

私有化大模型知识库部署指南：FastGPT 与 One-API 实践

私有化大模型知识库部署指南

准备环境

RAG 技术原理

FastGPT 服务部署

1. 下载配置文件

2. 启动容器服务

更多推荐文章

相关免费在线工具

3. 访问服务

One-API 服务部署

1. 部署 One-API

2. 配置渠道

3. 测试验证

4. 创建令牌

5. 配置 FastGPT

私有化 M3E 向量模型

1. 部署向量模型服务

2. 接入 One-API

3. 接入 FastGPT

4. 测试效果

常见问题排查

结语

更多推荐文章

相关免费在线工具

私有化大模型知识库部署指南：FastGPT 与 One-API 实践

私有化大模型知识库部署指南

准备环境

RAG 技术原理

FastGPT 服务部署

1. 下载配置文件

2. 启动容器服务

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 访问服务

One-API 服务部署

1. 部署 One-API

2. 配置渠道

3. 测试验证

4. 创建令牌

5. 配置 FastGPT

私有化 M3E 向量模型

1. 部署向量模型服务

2. 接入 One-API

3. 接入 FastGPT

4. 测试效果

常见问题排查

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具