DeepSeek-r1 本地部署指南
在云端 API 存在延迟、隐私顾虑或成本压力的情况下,本地部署大语言模型(LLM)是许多开发者和爱好者的首选方案。本文将详细介绍如何在 Windows 环境下,利用 Ollama 和 Chatbox 工具完成 DeepSeek-r1 模型的本地化运行与交互。
一、环境准备
1. 安装 Ollama
Ollama 是一个用于运行开源大模型的轻量级工具,支持 Windows、macOS 和 Linux。
- 下载地址:访问官网 https://ollama.com/ 获取对应系统版本。
- 安装步骤:
- 下载 Windows 安装包并运行。
- 按照向导完成安装,默认配置即可。
- 安装完成后,Ollama 服务将在后台自动启动。
注意:本教程基于 Windows 环境,其他系统操作逻辑类似。
2. 硬件需求评估
不同参数量级的模型对硬件资源要求差异较大。"b"代表十亿参数(Billion Parameters)。参数越多,智能越强,但显存和内存消耗也越高。
| 模型版本 | 推荐显卡门槛 | 硬盘空间预留 | 适用场景 |
|---|---|---|---|
| 1.5b | GTX 1050 | 5GB | 入门体验,低配笔记本 |
| 7b | GTX 1660 | 10GB | 主流台式机,平衡性能与资源 |
| 8b | GTX 3060 | 15GB | 进阶用户,推理速度较快 |
| 14b | GTX 3090 | 30GB | 高性能桌面,复杂任务处理 |
| 32b | GTX 4090 | 50GB | 专业级本地部署 |
| 70b | 双卡 4090 | 100GB | 极客玩家,高算力需求 |
| 671b | 多卡 H100 | 1000GB | 企业级集群,非个人设备 |
注:具体配置需根据实际显存大小调整,若显存不足可尝试量化版本(如 Q4_K_M)。
二、模型拉取与运行
1. 拉取模型
打开命令行工具(CMD 或 PowerShell),输入以下命令拉取 DeepSeek-r1 模型。建议优先选择适合您硬件的版本,例如 deepseek-r1:7b。


