10 分钟部署大模型：本地知识库搭建指南（Ollama + Dify + Docker）

10 分钟部署大模型：本地知识库搭建指南

前言

在数据隐私日益重要的今天，将大语言模型（LLM）部署在本地是一个极具价值的方案。通过构建本地知识库，你可以将私有文档、代码或数据投喂给模型，实现安全、高效的问答检索，且无需担心数据泄露。本文将详细介绍如何基于 Ollama、Docker 和 Dify 快速搭建一套完整的本地大模型知识库系统。

环境准备

为了保证流畅的推理体验，建议配置如下硬件环境：

CPU: Intel Xeon E5 系列或同等性能处理器
内存: 64GB RAM 及以上
显卡: NVIDIA RTX 2080 Ti (22GB) 或更高显存支持
操作系统: Windows 10/11 或 Linux (本教程以 Windows 为例)

第一步：安装与配置 Ollama

Ollama 是一个开源工具，允许用户在本地轻松运行和管理大语言模型。它简化了模型下载的复杂流程，提供了统一的 API 接口。

1. 下载与安装

访问 Ollama 官网下载对应操作系统的安装包，按照常规步骤完成安装。

Ollama 下载页面

2. 更改模型下载路径

默认情况下，Ollama 会将模型文件存储在 C 盘。由于大模型体积较大（通常数 GB 至数十 GB），为避免占用系统盘空间，建议修改存储路径。

打开系统环境变量设置。
新建用户变量 OLLAMA_MODELS。
值设置为一个非系统盘的目录路径，例如 D:\Ollama\Models。

环境变量设置

确保路径存在且当前用户对目录有读写权限。重启 Ollama 服务使配置生效。

3. 拉取大模型

打开命令行（CMD 或 PowerShell），使用以下命令拉取模型。这里以 llama3.1 为例：

ollama pull llama3.1

等待下载完成后，可以在命令行直接测试模型：

ollama run llama3.1

命令行运行模型

虽然命令行可用，但为了更友好的交互界面，我们需要引入 Dify。

第二步：部署 Docker Desktop

Dify 是一个开源的 LLM 应用开发平台，依赖 Docker 容器化运行。

访问 Docker 官网下载 Docker Desktop。
安装并启动 Docker Desktop，确保后台服务正常运行。

10 分钟部署大模型：本地知识库搭建指南（Ollama + Dify + Docker）