基于 Docker 的企业级检索增强生成(RAG)系统部署指南
在快速迭代的数字化时代,企业对于高效应用 AI 大模型的需求日益增长。然而,繁琐的技术流程、高昂的成本投入以及复杂的人员配置,常常让企业望而却步。本文介绍一款企业级开源知识库检索 AI 系统的搭建方法,通过容器化技术实现快速部署,帮助企业低成本构建私有化大模型应用。
一、系统架构与原理
本系统采用检索增强生成(Retrieval-Augmented Generation, RAG)架构。其核心逻辑是将企业的私有数据(如文档、手册、代码库等)转化为向量索引,当用户提问时,系统先从向量数据库中检索相关片段,再结合大语言模型(LLM)生成准确回答。这种方式有效解决了大模型幻觉问题,并确保了回答的时效性和准确性。
主要组件包括:
- 大语言模型(LLM):负责理解意图和生成文本,支持本地部署(如 Ollama)或在线 API。
- 向量数据库:存储文档切片后的向量数据,支持语义检索。
- 连接器(Connector):负责解析不同格式的文件(PDF, TXT, DOC 等)并进行向量化处理。
- 应用层:提供聊天界面和管理控制台,供用户交互和配置。
二、环境准备
在开始部署前,请确保您的服务器满足以下基础要求:
- 操作系统:Linux (Ubuntu/CentOS) 或 macOS。
- Docker:版本建议 20.10 以上,用于容器化管理。
- Git:用于拉取项目源码。
- 网络环境:首次拉取镜像可能需要稳定的网络连接。
三、部署步骤
1. 拉取源码
使用 Git 克隆项目仓库到本地服务器。
git clone <项目仓库地址>
cd onyx/deployment/docker_compose
2. 启动服务
进入 Docker Compose 部署目录,执行启动命令。此处建议使用开发模式配置进行初始化。
docker-compose -f docker-compose.dev.yml -p onyx-stack up -d --pull always --force-recreate
注意:如果涉及外部模型 API 调用,请确保服务器具备访问公网的能力。
3. 验证服务状态
启动完成后,检查容器运行状态:
docker ps -a | grep onyx
若所有服务显示 Up 状态,则说明部署成功。
四、系统配置
首次访问系统后,需要进行基础配置以启用功能。
1. 配置大语言模型(LLM)
进入管理后台的 LLM 配置页面,选择模型来源:
- 本地模型:推荐使用 Ollama。需先在本地安装 Ollama 并拉取模型(如 glm4, llama3, qwen2.5 等)。
- 在线 API:支持 OpenAI 等主流厂商接口。
若使用本地 Ollama 且在同一台机器上,API Base 地址填写:
http://localhost:11434
若非本机,请替换为实际 IP 地址。
配置完成后点击启用按钮,等待系统完成连接测试。


