跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonSaaSAI算法

Windows 平台本地 RAG 服务构建:Dify + Ollama + Qwen2.5 部署实践

在 Windows 平台上利用 Docker 部署 Dify 开源应用开发平台,并结合 Ollama 管理本地大模型 Qwen2.5 及 Embedding 模型的技术方案。内容涵盖系统环境准备、Dify 与 Ollama 的安装配置、模型下载与接入、以及 Dify 后台的具体设置步骤。通过该方案可实现数据的本地化处理,构建安全可控的 RAG 服务环境,解决了云端部署的数据隐私顾虑及成本问题。

内存管理发布于 2025/2/6更新于 2026/6/2533 浏览
Windows 平台本地 RAG 服务构建:Dify + Ollama + Qwen2.5 部署实践

Windows 平台本地 RAG 服务构建:Dify + Ollama + Qwen2.5 部署实践

在构建基于大语言模型(LLM)的检索增强生成(RAG)服务时,数据隐私和成本控制往往是企业关注的重点。为了在不依赖云端 API 的情况下实现私有化部署,采用 Dify 作为应用开发平台,结合 Ollama 管理本地大模型,并接入 Qwen2.5 与 Embedding 模型,是一个高效且灵活的方案。

主要工具介绍

Dify

Dify 是一款开源的大语言模型应用开发平台。它提供了可视化的操作界面,集成了 AI 工作流、RAG 管道、代理功能、模型管理及可观察性功能,支持从原型开发快速过渡到生产环境。

Ollama

Ollama 是一个开源的大模型管理工具,专注于本地模型的运行与管理。它简化了大模型的部署流程,支持多种主流模型格式,能够显著提高本地模型的推理速度和部署效率。

Qwen2.5

Qwen2.5 是通义千问团队最新开源的系列模型,涵盖 0.5B 至 72B 多种参数规模。该模型在预训练阶段使用了大规模数据集,包含多达 18 万亿个 tokens,在自然语言理解、文本生成、编程及数学能力上均有显著提升。

Docker

Docker 是一种轻量级的虚拟化技术及应用容器运行环境搭建平台。通过 Docker,开发者可以将应用及其依赖打包到一个可移植的容器中,并在 Linux 或 Windows 等系统上便捷运行。

部署 Dify

系统要求

在安装 Dify 之前,请确保您的机器满足以下最低系统要求:

  • CPU >= 2 Core
  • RAM >= 4GB

快速部署步骤

推荐使用 Docker Compose 进行一键部署。

  1. 克隆源代码:将 Dify 源代码克隆至本地。
    git clone https://github.com/langgenius/dify.git
    
  2. 进入目录:进入 docker 配置目录。
    cd dify/docker
    
  3. 配置环境变量:复制默认的环境变量文件。
    cp .env.example .env
    
  4. 启动服务:使用默认端口,一键启动所有服务。
    docker compose up -d
    

部署成功后,可通过浏览器访问服务地址。Docker Desktop 页面应显示所有容器状态为 Running。

注意:在 Windows 系统上,需要先安装 WSL (Windows Subsystem for Linux),以支持 Docker Desktop 的正常运行。

Dify Dashboard

部署 Ollama

下载与安装

访问 Ollama 官网下载对应系统的客户端。对于 Windows 用户,请下载 Windows 版本并完成安装运行。

Ollama Download

部署模型

大语言模型

下载并运行 qwen2.5:7b 模型。

ollama run qwen2.5:7b

Qwen Model

Embedding 模型

Embedding 技术用于将文本转换为数字向量,是实现 RAG 检索的关键。

  • 英文数据集:选用 nomic-embed-text。

    ollama pull nomic-embed-text
    

    Nomic Embed

  • 中文数据集:选用 bge-m3。

    ollama pull bge-m3
    

    BGE M3

配置 Dify 连接本地模型

设置账户

打开浏览器,输入 http://localhost/install,完成管理员账号的设置。

Install Account

配置模型供应商

  1. 点击右上角头像,点击'设置'按钮。
  2. 切换到模型供应商选项卡。
  3. 在下拉列表中找到并选择'Ollama'。

Settings

添加具体模型

  1. 配置 Qwen2.5:7b:填入对应的模型名称及 Ollama 服务地址。 Model Config
  2. 配置 Embedding 模型:分别添加 nomic-embed-text 和 bge-m3 作为文本嵌入模型。 Embed Config BGE Config

验证与常见问题

连接验证

配置完成后,建议在 Dify 的'模型提供商'页面进行测试请求,确保能正常调用本地 Ollama 接口。

常见问题排查

  1. 端口冲突:如果 Docker 启动失败,检查 80 或 5432 端口是否被占用。
  2. 模型加载慢:首次加载大模型可能需要较长时间,请耐心等待模型权重下载完成。
  3. 网络问题:确保 Dify 容器与 Ollama 服务之间网络互通,若 Ollama 运行在宿主机,需确认 Docker 网络配置允许访问 localhost。

总结

本文详细介绍了如何在 Windows 平台上将 Dify 进行本地私有化部署,并成功接入由 Ollama 管理的本地大模型(Qwen2.5)及 Embedding 模型,从而构建起完整的本地 RAG 服务环境。通过这一方案,用户可以完全掌控数据流向,无需依赖外部 API,适合对数据安全有较高要求的场景。后续可在此基础上进一步搭建企业知识库聊天机器人,实现更复杂的应用逻辑。

目录

  1. Windows 平台本地 RAG 服务构建:Dify + Ollama + Qwen2.5 部署实践
  2. 主要工具介绍
  3. Dify
  4. Ollama
  5. Qwen2.5
  6. Docker
  7. 部署 Dify
  8. 系统要求
  9. 快速部署步骤
  10. 部署 Ollama
  11. 下载与安装
  12. 部署模型
  13. 大语言模型
  14. Embedding 模型
  15. 配置 Dify 连接本地模型
  16. 设置账户
  17. 配置模型供应商
  18. 添加具体模型
  19. 验证与常见问题
  20. 连接验证
  21. 常见问题排查
  22. 总结
  • 免费图片AI生成工具免费生成了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 免费图片视频在线生成30秒,将你的创意变成现实开始设计
  • X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
  • 100+免费在线小游戏爽一把
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 计算机基础核心知识点:操作系统、网络、数据库与 C++
  • 大模型时代,新手与程序员如何转型入局 AI 行业
  • Java 编译报错:无效的目标发行版 17 与源发行版配置冲突
  • HarmonyOS 秋季更新深度解析:分布式架构与开发演进
  • Spring MVC 请求参数处理详解
  • 前端监控最佳实践:错误追踪与性能优化
  • A2UI 技术原理:AI Agent 如何安全生成富交互 UI
  • OpenClaw Gateway 卡死假死问题诊断与预防方案
  • Coze 工作流实战:逻辑控制、数据处理与 AIGC 多媒体应用
  • GitHub 镜像站点汇总及使用说明
  • 大模型百科:核心概念、架构解析与学习路径
  • 数据库迁移 TCO 拆解:MySQL 替代隐性成本与工具链实战
  • C++11 手写 Promise 实现及与 std::promise 对比
  • 大模型入门教程(二):LLM 的未来演进与安全性
  • AI 辅助蛋白质折叠预测:算法与生物学的结合
  • 基于魔搭社区环境从零开始微调 Yi 开源大模型
  • Cursor 集成 MCP 服务:从配置到实战
  • Spring Boot 集成 MyBatis 操作数据库详解
  • 复旦微 FMQL45T900 搭建 ARM+FPGA 开发环境指南
  • 2026 高校论文 AI 率新规与 AIGC 检测要求汇总

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online