DeepSeek-R1 模型因其先进的功能和成本效益而备受关注。在本地运行此模型能够深入了解 AI 技术,同时保障数据隐私。本文将引导您完成在本地机器上设置和运行 DeepSeek-R1 模型的全过程,涵盖硬件要求、必要工具的安装以及客户端的使用。
1. DeepSeek-R1 模型版本说明与硬件需求
DeepSeek-R1 提供多种版本,每个版本都有特定的硬件要求,请根据您的设备配置选择合适的模型。
全参数模型 (Full Parameters)
这是 R1 的原始版本,包含大量参数,精度高,但需要巨大的计算资源。
- 参数量:671B
- 显存需求:约 1342GB
- 硬件建议:需要使用多 GPU 集群,例如 NVIDIA A100 80GB 显卡共 16 张。
- 平台支持:不支持单台 Mac 电脑,但支持 Mac 电脑集群环境。
蒸馏模型 (Distilled Models)
蒸馏模型通过知识蒸馏,让较小的模型学习较大模型的行为,从而在扩充性能的同时减少资源需求。
- 适用场景:适合消费级显卡或内存有限的设备。
- 推荐型号:7B 和 8B 模型可用于 32GB 显存的 Mac,是性能和参数平衡后的最佳选择。
量化模型 (Quantized Models, 4-bit)
量化模型将精度降低至 4bit,大幅降低显存占用。
- 原理:通过压缩权重减少内存占用,通常伴随微小的精度损失。
- 优势:相比全参数模型,显存需求可忽略不计,适合个人电脑部署。
2. 电脑端安装指南:Ollama
Ollama 是一款流行的在本地运行大模型的工具,支持 macOS、Windows 和 Linux。
安装步骤
- macOS / Linux
打开终端,运行以下命令安装 Ollama:
curl -fsSL https://ollama.ai/install.sh | sh - Windows 访问 Ollama 官网下载 Windows 安装包,双击运行并按照向导完成安装。
启动服务
安装完成后,Ollama 默认会在本地 11434 端口开启服务。您可以在终端中验证:
ollama list
如果看到已下载的模型列表,说明服务正常。
拉取模型
在终端中搜索并拉取 DeepSeek 模型:
ollama pull deepseek-r1:latest
或者指定具体版本(如 7B):
ollama pull deepseek-r1:7b
3. 开源大模型 UI 客户端
为了获得更好的交互体验,建议使用图形化界面客户端。
Open WebUI
Open WebUI 支持 Docker 部署,简单方便,功能丰富。
Docker 部署命令:
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main


