10 分钟部署本地大模型知识库:Ollama 与 Dify 环境搭建
前言
在人工智能飞速发展的今天,大语言模型(LLM)的应用场景日益广泛。然而,将数据上传至公有云大模型服务往往伴随着隐私泄露的风险。对于企业或个人而言,构建一个完全私有化、本地化的大模型知识库是保障数据安全的关键方案。
本教程将详细介绍如何在 Windows 环境下,利用 Ollama、Docker 和 Dify 快速搭建一套本地大模型知识库系统。通过这套方案,你可以将本地的文档、笔记、代码库等数据导入知识库,实现基于私有数据的智能问答,且所有数据处理均在本地完成,无需担心数据外泄。
一、环境准备
1. 硬件要求
虽然不同模型对资源需求不同,但为了流畅运行主流开源大模型并构建知识库,建议配置如下:
- CPU: 多核处理器(如 Intel Xeon E5 系列或同级别消费级 CPU)
- 内存: 至少 32GB,推荐 64GB 或以上,用于加载模型和向量数据库
- 显卡: NVIDIA GPU,显存建议 8GB 以上(如 RTX 2080 Ti, 3060, 4090 等),支持 CUDA 加速推理
- 硬盘: SSD 固态硬盘,预留 50GB 以上空间用于存储模型文件和向量索引
2. 软件依赖
- 操作系统: Windows 10/11 (需开启 WSL2 或 Docker Desktop)
- Docker Desktop: 用于容器化管理
- Git: 用于拉取 Dify 项目代码
- PowerShell/CMD: 命令行工具
二、安装与配置 Ollama
Ollama 是一个开源工具,允许用户在本地轻松运行和管理大语言模型。它简化了模型下载、管理和运行的流程。
1. 下载安装
访问 Ollama 官网下载 Windows 版本安装包,按照常规步骤完成安装。
2. 修改模型下载路径
默认情况下,Ollama 会将模型文件存储在 C 盘根目录下。随着模型数量的增加,C 盘空间极易耗尽。因此,我们需要更改模型存储路径。
操作步骤:
- 打开 Windows 搜索栏,输入"环境变量",选择"编辑系统环境变量"。
- 在弹出的窗口中点击"环境变量"按钮。
- 在"系统变量"区域,点击"新建"。
- 变量名填写:
OLLAMA_MODELS - 变量值填写:你希望存放模型的磁盘路径,例如
D:\Ollama_Models - 点击确定保存。
- 重要:修改环境变量后,需要重启电脑或重新登录系统才能生效。
3. 下载大模型
配置完成后,打开 PowerShell 或 CMD,使用以下命令下载模型。这里以 Llama3.1 为例:
ollama pull llama3.1
等待下载进度条完成。下载过程中会显示文件大小和速度。下载完成后,你可以在命令行直接测试模型:
ollama run llama3.1
输入简单的指令如"Hello",如果模型能正常回复,说明安装成功。
三、部署 Docker Desktop
Dify 是一个开源的 LLM 应用开发平台,基于 Docker Compose 进行部署。因此需要先安装 Docker Desktop。
1. 下载安装
访问 Docker 官网下载 Docker Desktop for Windows 版本并完成安装。


