基于 Docker 的企业级检索增强生成（RAG）系统部署指南

在快速迭代的数字化时代，企业对于高效应用 AI 大模型的需求日益增长。然而，繁琐的技术流程、高昂的成本投入以及复杂的人员配置，常常让企业望而却步。本文介绍一款企业级开源知识库检索 AI 系统的搭建方法，通过容器化技术实现快速部署，帮助企业低成本构建私有化大模型应用。

一、系统架构与原理

本系统采用检索增强生成（Retrieval-Augmented Generation, RAG）架构。其核心逻辑是将企业的私有数据（如文档、手册、代码库等）转化为向量索引，当用户提问时，系统先从向量数据库中检索相关片段，再结合大语言模型（LLM）生成准确回答。这种方式有效解决了大模型幻觉问题，并确保了回答的时效性和准确性。

主要组件包括：

大语言模型（LLM）：负责理解意图和生成文本，支持本地部署（如 Ollama）或在线 API。
向量数据库：存储文档切片后的向量数据，支持语义检索。
连接器（Connector）：负责解析不同格式的文件（PDF, TXT, DOC 等）并进行向量化处理。
应用层：提供聊天界面和管理控制台，供用户交互和配置。

二、环境准备

在开始部署前，请确保您的服务器满足以下基础要求：

操作系统：Linux (Ubuntu/CentOS) 或 macOS。
Docker：版本建议 20.10 以上，用于容器化管理。
Git：用于拉取项目源码。
网络环境：首次拉取镜像可能需要稳定的网络连接。

三、部署步骤

1. 拉取源码

使用 Git 克隆项目仓库到本地服务器。

git clone <项目仓库地址>
cd onyx/deployment/docker_compose

2. 启动服务

进入 Docker Compose 部署目录，执行启动命令。此处建议使用开发模式配置进行初始化。

docker-compose -f docker-compose.dev.yml -p onyx-stack up -d --pull always --force-recreate

注意：如果涉及外部模型 API 调用，请确保服务器具备访问公网的能力。

3. 验证服务状态

启动完成后，检查容器运行状态：

docker ps -a | grep onyx

若所有服务显示 Up 状态，则说明部署成功。

四、系统配置

首次访问系统后，需要进行基础配置以启用功能。

1. 配置大语言模型（LLM）

进入管理后台的 LLM 配置页面，选择模型来源：

本地模型：推荐使用 Ollama。需先在本地安装 Ollama 并拉取模型（如 glm4, llama3, qwen2.5 等）。
在线 API：支持 OpenAI 等主流厂商接口。

若使用本地 Ollama 且在同一台机器上，API Base 地址填写：

http://localhost:11434

若非本机，请替换为实际 IP 地址。

配置完成后点击启用按钮，等待系统完成连接测试。

基于 Docker 的企业级检索增强生成（RAG）系统部署指南