10 分钟部署大模型:本地知识库搭建指南
前言
在数据隐私日益重要的今天,将大语言模型(LLM)部署在本地是一个极具价值的方案。通过构建本地知识库,你可以将私有文档、代码或数据投喂给模型,实现安全、高效的问答检索,且无需担心数据泄露。本文将详细介绍如何基于 Ollama、Docker 和 Dify 快速搭建一套完整的本地大模型知识库系统。
环境准备
为了保证流畅的推理体验,建议配置如下硬件环境:
- CPU: Intel Xeon E5 系列或同等性能处理器
- 内存: 64GB RAM 及以上
- 显卡: NVIDIA RTX 2080 Ti (22GB) 或更高显存支持
- 操作系统: Windows 10/11 或 Linux (本教程以 Windows 为例)
第一步:安装与配置 Ollama
Ollama 是一个开源工具,允许用户在本地轻松运行和管理大语言模型。它简化了模型下载的复杂流程,提供了统一的 API 接口。
1. 下载与安装
访问 Ollama 官网下载对应操作系统的安装包,按照常规步骤完成安装。

2. 更改模型下载路径
默认情况下,Ollama 会将模型文件存储在 C 盘。由于大模型体积较大(通常数 GB 至数十 GB),为避免占用系统盘空间,建议修改存储路径。
- 打开系统环境变量设置。
- 新建用户变量
OLLAMA_MODELS。 - 值设置为一个非系统盘的目录路径,例如
D:\Ollama\Models。

确保路径存在且当前用户对目录有读写权限。重启 Ollama 服务使配置生效。
3. 拉取大模型
打开命令行(CMD 或 PowerShell),使用以下命令拉取模型。这里以 llama3.1 为例:
ollama pull llama3.1
等待下载完成后,可以在命令行直接测试模型:
ollama run llama3.1

虽然命令行可用,但为了更友好的交互界面,我们需要引入 Dify。
第二步:部署 Docker Desktop
Dify 是一个开源的 LLM 应用开发平台,依赖 Docker 容器化运行。
- 访问 Docker 官网下载 Docker Desktop。
- 安装并启动 Docker Desktop,确保后台服务正常运行。



