基于 Ollama 与 Page Assist 本地部署 DeepSeek-R1 搭建个人 AI 知识库
随着大语言模型(LLM)技术的飞速发展,如何在保障数据隐私的前提下利用 AI 能力处理个人知识成为了许多开发者和用户的关注焦点。本文将详细介绍如何在 Windows 环境下,利用开源工具 Ollama 和本地浏览器插件 Page Assist,部署 DeepSeek-R1 大模型并构建支持联网搜索的个人 AI 知识库。通过 RAG(检索增强生成)技术,用户可以上传私有文档进行智能问答,实现低成本、高隐私的 AI 应用体验。
一、方案优势与适用场景
1.1 核心优势
- 数据隐私:所有模型推理和数据处理均在本地完成,敏感信息无需上传至云端服务器。
- 零成本:DeepSeek-R1 等开源模型免费使用,无需支付 API 调用费用。
- 灵活扩展:支持自定义知识库,可结合 PDF、Markdown 等多种格式文件。
- 联网能力:配置后可开启联网搜索功能,弥补本地模型知识截止的缺陷。
1.2 适用人群
- 希望搭建私有知识库的开发者。
- 对数据安全有严格要求的企业或个人用户。
- 需要离线或内网环境运行 AI 模型的场景。
二、环境准备与硬件要求
在开始部署之前,请确保您的计算机满足以下基本要求:
- 操作系统:Windows 10/11 64 位(本文以 Windows 为例)。
- 内存(RAM):建议至少 16GB,若运行较大参数模型建议 32GB 以上。
- 显卡(GPU):NVIDIA 显卡支持 CUDA 加速效果更佳,但 CPU 亦可运行量化版本。
- 磁盘空间:预留至少 20GB 空间用于存储模型文件和知识库索引。
三、步骤一:安装与配置 Ollama
Ollama 是一个用于运行大型语言模型的轻量级工具,支持多种主流模型架构。
3.1 下载与安装
- 访问 Ollama 官方网站下载对应系统的安装包。
- 运行安装程序,在安装过程中建议选择自定义路径(例如 D 盘),以避免占用系统盘空间。
- 安装完成后,Ollama 将在后台启动服务,默认监听
localhost:11434端口。
3.2 验证安装
打开命令提示符(CMD)或 PowerShell,输入以下命令检查服务状态:
ollama list
若显示服务正在运行且无报错,则说明安装成功。
四、步骤二:拉取 DeepSeek-R1 与 Embedding 模型
为了构建完整的知识库问答系统,我们需要两个核心组件:一个用于对话的大语言模型,以及一个用于文本向量的嵌入模型。
4.1 部署 DeepSeek-R1
DeepSeek-R1 是高性能的开源推理模型。我们选择轻量化的 1.5B 版本以便在普通硬件上流畅运行。
在 CMD 窗口中执行以下命令拉取模型:
ollama run deepseek-r1:1.5b
首次运行会自动下载模型权重,请耐心等待下载完成。下载后,您可以直接在该终端窗口中与模型交互进行测试。
4.2 部署 Nomic Embed Text
为了实现 RAG(检索增强生成),我们需要将文档内容转化为向量。Nomic Embed Text 是一款优秀的开源嵌入模型。
执行以下命令拉取嵌入模型:
ollama pull nomic-embed-text


