基于 Docker 部署 FastGPT 与本地大模型实战指南 | 极客日志

Shell / BashAI算法

基于 Docker 部署 FastGPT 与本地大模型实战指南

综述由AI生成基于 Docker 部署 FastGPT 与本地大模型的完整流程。内容涵盖 Docker 及 Compose 的安装配置，FastGPT 的快速部署方法，OneAPI 作为模型网关的渠道配置（包括线上零一万物模型与本地 Ollama 模型），以及 M3E 向量模型的接入以实现 RAG 知识库功能。文章还补充了网络安全加固建议、常见故障排查技巧及性能优化方案，旨在帮助技术人员构建稳定、私有的大模型应用环境，为 AI 工程化落地提供实践参考。

花里胡哨发布于 2025/2/6更新于 2026/6/222 浏览

基于 Docker 部署 FastGPT 与本地大模型实战指南

概述

随着大语言模型（LLM）技术的快速发展，企业和个人对私有化部署大模型的需求日益增长。本文详细介绍如何搭建一套完整的本地大模型应用环境，包括使用 Docker 容器化技术安装基础组件，配置 FastGPT 作为前端交互界面，利用 OneAPI 作为模型代理网关，以及接入 Ollama 实现本地模型推理和 M3E 向量模型支持知识库检索。

本方案适用于希望在大模型领域进行技术转型、开发 AI 应用或构建企业内部知识库的技术人员。

1. 环境准备与工具介绍

1.1 核心工具链

Docker: 用于容器化部署所有服务，确保环境一致性。
OneAPI: 开源的 API 管理网关，统一不同大模型的接口标准，支持多模型路由。
FastGPT: 基于 LLM 的问答系统框架，提供可视化编排和知识库管理功能。
Ollama: 本地运行大模型的工具，支持多种量化模型，适合隐私敏感场景。

1.2 系统要求

操作系统：Linux (Ubuntu/CentOS) 或 macOS
内存：建议至少 8GB RAM（运行本地模型时建议 16GB+）
磁盘：预留 50GB 以上空间用于存储镜像和模型文件

2. 安装 Docker 环境

注意：如果系统中已安装 Docker，可跳过此步骤，但请确保版本为 20.10 以上。

2.1 安装 Docker Engine

执行以下命令安装 Docker（建议使用国内镜像源以加速下载）：

curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun
systemctl enable --now docker

2.2 安装 Docker Compose

Docker Compose 用于管理多容器应用。由于 GitHub 下载可能较慢，可使用镜像站地址：

curl -L https://github.com/docker/compose/releases/download/v2.20.3/docker-compose-$(uname -s)-$(uname -m) -o /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose

若 GitHub 访问受限，可替换为镜像地址：

curl -L https://hub.nuaa.cf/docker/compose/releases/download/v2.20.3/docker-compose-$(uname -s)-$(uname -m) -o /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose

2.3 验证安装

启动 Docker 服务并检查版本号：

sudo systemctl start docker
docker -v
docker-compose -v

若输出版本号信息，说明安装成功。

3. 部署 FastGPT

FastGPT 是一个开源的 LLM 应用开发平台，支持快速构建对话机器人。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

mkdir -p /usr/local/fastgpt
cd /usr/local/fastgpt/

curl -O https://raw.githubusercontent.com/labring/FastGPT/main/files/deploy/fastgpt/docker-compose.yml
curl -O https://raw.githubusercontent.com/labring/FastGPT/main/projects/app/data/config.json

docker-compose up -d

docker-compose down
docker-compose up -d

curl -fsSL https://ollama.com/install.sh | sh

systemctl daemon-reload
systemctl restart ollama

ollama pull qwen:7b

ollama run qwen:7b
# 按 Ctrl+D 退出

docker run registry.cn-hangzhou.aliyuncs.com/fastgpt_docker/m3e-large-api:latest

基于 Docker 部署 FastGPT 与本地大模型实战指南

基于 Docker 部署 FastGPT 与本地大模型实战指南

概述

1. 环境准备与工具介绍

1.1 核心工具链

1.2 系统要求

2. 安装 Docker 环境

2.1 安装 Docker Engine

2.2 安装 Docker Compose

2.3 验证安装

3. 部署 FastGPT

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.1 创建部署目录

3.2 下载配置文件

3.3 启动服务

4. 配置 OneAPI 模型网关

4.1 注册第三方模型账号

4.2 启动 OneAPI

4.3 添加渠道配置

5. 集成 FastGPT 与 OneAPI

5.1 修改 FastGPT 配置

5.2 创建应用

6. 部署本地大模型 (Ollama)

6.1 安装 Ollama

6.2 配置网络访问

6.3 下载模型

7. 本地模型接入 OneAPI

7.1 添加 Ollama 渠道

7.2 测试与验证

7.3 更新 FastGPT 配置

8. 构建本地知识库 (RAG)

8.1 安装向量模型服务

8.2 配置向量通道

8.3 启用知识库索引

8.4 创建知识库与应用关联

9. 常见问题与优化建议

9.1 性能优化

9.2 安全性加固

9.3 故障排查

10. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具