跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
Shell / BashNode.jsSaaSAI

本地知识库部署:FastGPT 与 Dify 对接 Ollama 指南

综述由AI生成在本地环境中使用 Docker 部署 Dify 和 FastGPT 知识库平台的方法,并详细说明了如何将两者与 Ollama 本地大语言模型进行对接。内容涵盖环境准备、镜像拉取、配置文件修改、端口映射及常见网络问题排查,旨在帮助用户构建私有化、安全可控的 AI 知识库系统,实现离线或内网环境下的智能问答功能。

并发大师发布于 2025/2/7更新于 2026/5/39 浏览
本地知识库部署:FastGPT 与 Dify 对接 Ollama 指南

本地知识库部署:FastGPT 与 Dify 对接 Ollama 指南

前言

在数据隐私和安全性日益受到重视的今天,将大语言模型(LLM)及知识库应用部署在本地环境成为了许多开发者和企业的首选。本文详细介绍了如何在本地环境中使用 Docker 部署 Dify 和 FastGPT 两个主流的知识库平台,并将它们与 Ollama 本地大语言模型进行对接,实现私有化、离线或内网环境下的智能问答功能。

一、环境准备

1.1 硬件要求

  • CPU: 建议 4 核及以上,支持虚拟化技术。
  • 内存: 至少 16GB RAM(运行 3B 参数量的模型时建议 16GB+,若运行更大模型需增加至 32GB 或以上)。
  • 存储: 预留 50GB 以上可用空间用于镜像、模型权重及数据库文件。
  • 网络: 稳定的网络连接用于首次拉取 Docker 镜像。

1.2 软件依赖

  • 操作系统: macOS (M1/M2/M3), Linux (Ubuntu 20.04+), Windows 10/11。
  • Docker Engine: 版本 20.10 及以上。
  • Docker Compose: 版本 2.0 及以上(部分旧版命令为 docker-compose)。
  • Ollama: 最新版本。

注意:Mac M3 用户需注意散热问题,运行 3B 大小模型时温度可能接近极限,建议选择量化程度较高的较小模型以平衡性能与发热。

二、部署 Dify

Dify 是一个开源的 LLM 应用开发平台,支持快速构建 RAG(检索增强生成)应用。

2.1 获取代码

访问 Dify GitHub 仓库,下载最新稳定版的源代码或 ZIP 包。

2.2 启动服务

进入解压后的 docker 文件夹,执行以下命令自动下载镜像并启动容器:

docker-compose up -d

该过程可能需要几分钟,取决于网络状况。若遇到镜像拉取失败,请配置国内镜像加速器。

2.3 初始化配置

服务启动后,在浏览器访问 http://localhost/install 完成管理员账号注册。

2.4 调整文件上传限制

默认情况下,Dify 对上传文件大小有限制(如 15MB)。如需修改,编辑 docker 目录下的 .env 文件:

# Upload file size limit, default 15M.
UPLOAD_FILE_SIZE_LIMIT=150

NGINX_CLIENT_MAX_BODY_SIZE=150M

修改后重启容器生效:

docker-compose restart

三、部署 FastGPT

FastGPT 是另一个开源的 AI 知识库工具,基于 Node.js 构建,适合需要高度定制的场景。

3.1 获取代码

从 FastGPT 官方仓库下载源码,进入 files/docker 目录。

3.2 配置文件准备

FastGPT 默认不包含 docker-compose.yml,需指定配置文件。推荐使用 docker-compose-pgvector.yml。 同时需要在 docker 目录下创建 config.json 文件,配置基础信息。示例如下:

{
  "systemEnv": {
    "OPENAI_API_KEY": "sk-xxxx"
  },
  "llmModels": [
    {
      "model": "llama3.2:3b",
      "name": "llama3.2:3b",
      "avatar": "/imgs/model/openai.svg",
      "maxContext": 125000,
      "maxResponse": 4000,
      "quoteMaxToken": 120000,
      "maxTemperature": 1.2,
      "charsPointsPrice": 0,
      "censor": false,
      "vision": true,
      "datasetProcess": true,
      "usedInClassify": true,
      "usedInExtractFields": true,
      "usedInToolCall": true,
      "usedInQueryExtension": true,
      "toolChoice": true,
      "functionCall": false,
      "customCQPrompt": "",
      "customExtractPrompt": "",
      "defaultSystemChatPrompt": "",
      "defaultConfig": {},
      "fieldMap": {}
    }
  ]
}

3.3 启动服务

执行以下命令启动 FastGPT:

docker-compose -f docker-compose-pgvector.yml up -d

3.4 访问与登录

  • 主页面: http://localhost:3000
  • 模型配置页: http://localhost:3001
  • 默认账号: root
  • 默认密码: 可在 config.json 中查看或重置,初始通常为 1234。

四、本地部署 Ollama

Ollama 是一个运行本地大模型的轻量级工具,支持多种模型格式。

4.1 安装 Ollama

前往 Ollama 官网下载对应系统的安装包并安装。

4.2 拉取模型

以 llama3.2 为例,在终端执行:

ollama run llama3.2:3b

运行期间可输入 /bye 退出会话。

4.3 验证服务

确保 Ollama 服务正在运行,默认监听端口为 11434。

五、对接 Ollama 模型

5.1 Dify 对接

  1. 打开 Dify 控制台,进入 设置 -> 模型供应商。
  2. 选择 Ollama。
  3. 填写模型名称:llama3.2:3b。
  4. 基础 URL 填写:http://host.docker.internal:11434。

    注意:host.docker.internal 允许容器访问宿主机网络。若在 Linux 上,可能需要配置 extra_hosts 或使用宿主机 IP。

  5. 保存并测试连接。

5.2 FastGPT 对接

  1. 登录 FastGPT 模型配置页面 (http://localhost:3001)。
  2. 选择 渠道 -> 添加新渠道。
  3. 类型选择 Ollama。
  4. 名称填写:llama3.2:3b。
  5. 代理地址填写:http://host.docker.internal:11434。
  6. 密钥项必填,可随意填写字符(FastGPT 内部校验较宽松)。
  7. 修改 config.json 中的 llmModels 数组(参考上文),保存后重启服务:
    docker-compose down
    docker-compose -f docker-compose-pgvector.yml up -d
    

六、常见问题排查

6.1 容器无法访问 Ollama

若容器内无法连接 Ollama,检查网络模式。Docker 容器默认隔离网络,需确保 Ollama 暴露端口且容器能解析 host.docker.internal。

  • Linux 方案: 在 docker-compose.yml 中添加 extra_hosts: ["host.docker.internal:host-gateway"]。
  • Windows/macOS: 通常默认支持,若失败可尝试使用宿主机 IP 替换 host.docker.internal。

6.2 模型加载慢或显存不足

  • 尝试使用量化版本模型(如 q4_0, q8_0)。
  • 减少并发请求数。
  • 关闭其他占用 GPU/CPU 的应用。

6.3 文件上传失败

  • 检查 Nginx 配置中的 client_max_body_size。
  • 确认 .env 文件中 UPLOAD_FILE_SIZE_LIMIT 已正确修改并重启。

七、安全与维护建议

  1. 修改默认密码: 生产环境务必修改 root 账号密码,避免被未授权访问。
  2. 防火墙策略: 仅开放必要端口(如 3000, 3001, 11434),限制来源 IP。
  3. 定期备份: 定期备份 Docker volumes 中的数据,防止数据丢失。
  4. 更新维护: 关注官方发布的安全补丁,及时更新镜像版本。

通过上述步骤,您已成功搭建了一套本地化的 AI 知识库系统。这种组合特别适合需要在本地高效管理和利用知识的场景,既保证了数据隐私,又提供了灵活的扩展能力。

目录

  1. 本地知识库部署:FastGPT 与 Dify 对接 Ollama 指南
  2. 前言
  3. 一、环境准备
  4. 1.1 硬件要求
  5. 1.2 软件依赖
  6. 二、部署 Dify
  7. 2.1 获取代码
  8. 2.2 启动服务
  9. 2.3 初始化配置
  10. 2.4 调整文件上传限制
  11. Upload file size limit, default 15M.
  12. 三、部署 FastGPT
  13. 3.1 获取代码
  14. 3.2 配置文件准备
  15. 3.3 启动服务
  16. 3.4 访问与登录
  17. 四、本地部署 Ollama
  18. 4.1 安装 Ollama
  19. 4.2 拉取模型
  20. 4.3 验证服务
  21. 五、对接 Ollama 模型
  22. 5.1 Dify 对接
  23. 5.2 FastGPT 对接
  24. 六、常见问题排查
  25. 6.1 容器无法访问 Ollama
  26. 6.2 模型加载慢或显存不足
  27. 6.3 文件上传失败
  28. 七、安全与维护建议
  • 💰 8折买阿里云服务器限时8折了解详情
  • GPT-5.5 超高智商模型1元抵1刀ChatGPT中转购买
  • 代充Chatgpt Plus/pro 帐号了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 宇树 G1 机器人有线与无线连接配置指南
  • Windows 本地部署 Ollama 与 OpenClaw 实现 AI 自动化任务
  • 宇树 G1 机器人开发:有线与无线连接配置指南
  • MATLAB 遗传算法求解函数极值入门指南
  • FPGA 光通信开发:Aurora 64B/66B 协议使用指南
  • Dify 集成 MySQL 实战:基于 MCP 协议的数据查询方案
  • 使用 Ollama 本地部署 LLaMA 大模型
  • 使用 Docker 部署 Apache Answer 并通过 cpolar 实现公网访问
  • Java 面试基础:封装、继承与多态详解
  • Open Interpreter 接入智谱 GLM-4:打造本地电脑控制 AI Agent
  • GitCode 克隆代码认证失败,需改用个人访问令牌或 SSH
  • Kubernetes 集群 Dashboard 与 Kuboard 安装指南
  • 神的泪水-构建与解析:基于多AI模型并行的内容生成与对比分析工作流
  • 基于 Next.js 与 Wagmi 实现 TokenP 钱包登录的 DApp 前端开发
  • 《利用 Python 进行数据分析》阅读心得与技术实践指南
  • AI 编码 Agent 架构对比:Claude Code、OpenClaw、OpenCode 与 SkillLite
  • 哈希桶的模拟实现(开散列)
  • C++ vector 容器使用、迭代器失效与模拟实现
  • RAG 检索增强生成技术:现状、挑战与优化方案
  • PowerShell 中 Invoke-WebRequest 正确使用:避免参数匹配错误

相关免费在线工具

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online

  • Base64 文件转换器

    将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online

  • Markdown转HTML

    将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online