本地知识库部署：FastGPT 与 Dify 对接 Ollama 指南 | 极客日志

Shell / BashNode.jsSaaSAI

本地知识库部署：FastGPT 与 Dify 对接 Ollama 指南

综述由AI生成在本地环境中使用 Docker 部署 Dify 和 FastGPT 知识库平台的方法，并详细说明了如何将两者与 Ollama 本地大语言模型进行对接。内容涵盖环境准备、镜像拉取、配置文件修改、端口映射及常见网络问题排查，旨在帮助用户构建私有化、安全可控的 AI 知识库系统，实现离线或内网环境下的智能问答功能。

并发大师发布于 2025/2/7更新于 2026/5/3118 浏览

本地知识库部署：FastGPT 与 Dify 对接 Ollama 指南

前言

在数据隐私和安全性日益受到重视的今天，将大语言模型（LLM）及知识库应用部署在本地环境成为了许多开发者和企业的首选。本文详细介绍了如何在本地环境中使用 Docker 部署 Dify 和 FastGPT 两个主流的知识库平台，并将它们与 Ollama 本地大语言模型进行对接，实现私有化、离线或内网环境下的智能问答功能。

一、环境准备

1.1 硬件要求

CPU: 建议 4 核及以上，支持虚拟化技术。
内存: 至少 16GB RAM（运行 3B 参数量的模型时建议 16GB+，若运行更大模型需增加至 32GB 或以上）。
存储: 预留 50GB 以上可用空间用于镜像、模型权重及数据库文件。
网络: 稳定的网络连接用于首次拉取 Docker 镜像。

1.2 软件依赖

操作系统: macOS (M1/M2/M3), Linux (Ubuntu 20.04+), Windows 10/11。
Docker Engine: 版本 20.10 及以上。
Docker Compose: 版本 2.0 及以上（部分旧版命令为 docker-compose）。
Ollama: 最新版本。

注意：Mac M3 用户需注意散热问题，运行 3B 大小模型时温度可能接近极限，建议选择量化程度较高的较小模型以平衡性能与发热。

二、部署 Dify

Dify 是一个开源的 LLM 应用开发平台，支持快速构建 RAG（检索增强生成）应用。

2.1 获取代码

访问 Dify GitHub 仓库，下载最新稳定版的源代码或 ZIP 包。

2.2 启动服务

进入解压后的 docker 文件夹，执行以下命令自动下载镜像并启动容器：

docker-compose up -d

该过程可能需要几分钟，取决于网络状况。若遇到镜像拉取失败，请配置国内镜像加速器。

2.3 初始化配置

服务启动后，在浏览器访问 http://localhost/install 完成管理员账号注册。

2.4 调整文件上传限制

默认情况下，Dify 对上传文件大小有限制（如 15MB）。如需修改，编辑 docker 目录下的 .env 文件：

# Upload file size limit, default 15M.
UPLOAD_FILE_SIZE_LIMIT=150

NGINX_CLIENT_MAX_BODY_SIZE=150M

修改后重启容器生效：

docker-compose restart

三、部署 FastGPT

FastGPT 是另一个开源的 AI 知识库工具，基于 Node.js 构建，适合需要高度定制的场景。

3.1 获取代码

从 FastGPT 官方仓库下载源码，进入 files/docker 目录。

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

{
  "systemEnv": {
    "OPENAI_API_KEY": "sk-xxxx"
  },
  "llmModels": [
    {
      "model": "llama3.2:3b",
      "name": "llama3.2:3b",
      "avatar": "/imgs/model/openai.svg",
      "maxContext": 125000,
      "maxResponse": 4000,
      "quoteMaxToken": 120000,
      "maxTemperature": 1.2,
      "charsPointsPrice": 0,
      "censor": false,
      "vision": true,
      "datasetProcess": true,
      "usedInClassify": true,
      "usedInExtractFields": true,
      "usedInToolCall": true,
      "usedInQueryExtension": true,
      "toolChoice": true,
      "functionCall": false,
      "customCQPrompt": "",
      "customExtractPrompt": "",
      "defaultSystemChatPrompt": "",
      "defaultConfig": {},
      "fieldMap": {}
    }
  ]
}

docker-compose -f docker-compose-pgvector.yml up -d

ollama run llama3.2:3b

登录 FastGPT 模型配置页面 (http://localhost:3001)。
选择渠道 -> 添加新渠道。
类型选择 Ollama。
名称填写：llama3.2:3b。
代理地址填写：http://host.docker.internal:11434。
密钥项必填，可随意填写字符（FastGPT 内部校验较宽松）。
修改 config.json 中的 llmModels 数组（参考上文），保存后重启服务：
```
docker-compose down
docker-compose -f docker-compose-pgvector.yml up -d
```

本地知识库部署：FastGPT 与 Dify 对接 Ollama 指南

本地知识库部署：FastGPT 与 Dify 对接 Ollama 指南

前言

一、环境准备

1.1 硬件要求

1.2 软件依赖

二、部署 Dify

2.1 获取代码

2.2 启动服务

2.3 初始化配置

2.4 调整文件上传限制

三、部署 FastGPT

3.1 获取代码

更多推荐文章

相关免费在线工具

3.2 配置文件准备

3.3 启动服务

3.4 访问与登录

四、本地部署 Ollama

4.1 安装 Ollama

4.2 拉取模型

4.3 验证服务

五、对接 Ollama 模型

5.1 Dify 对接

5.2 FastGPT 对接

六、常见问题排查

6.1 容器无法访问 Ollama

6.2 模型加载慢或显存不足

6.3 文件上传失败

七、安全与维护建议

更多推荐文章

相关免费在线工具

本地知识库部署：FastGPT 与 Dify 对接 Ollama 指南

本地知识库部署：FastGPT 与 Dify 对接 Ollama 指南

前言

一、环境准备

1.1 硬件要求

1.2 软件依赖

二、部署 Dify

2.1 获取代码

2.2 启动服务

2.3 初始化配置

2.4 调整文件上传限制

三、部署 FastGPT

3.1 获取代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 配置文件准备

3.3 启动服务

3.4 访问与登录

四、本地部署 Ollama

4.1 安装 Ollama

4.2 拉取模型

4.3 验证服务

五、对接 Ollama 模型

5.1 Dify 对接

5.2 FastGPT 对接

六、常见问题排查

6.1 容器无法访问 Ollama

6.2 模型加载慢或显存不足

6.3 文件上传失败

七、安全与维护建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具