本地部署 DeepSeek-R1 模型：电脑与手机方案及硬件需求详解

DeepSeek-R1 模型因其先进的功能和成本效益而备受关注。在本地运行此模型能够深入了解 AI 技术，同时保障数据隐私。本文将引导您完成在本地机器上设置和运行 DeepSeek-R1 模型的全过程，涵盖硬件要求、必要工具的安装以及客户端的使用。

1. DeepSeek-R1 模型版本说明与硬件需求

DeepSeek-R1 提供多种版本，每个版本都有特定的硬件要求，请根据您的设备配置选择合适的模型。

全参数模型 (Full Parameters)

这是 R1 的原始版本，包含大量参数，精度高，但需要巨大的计算资源。

参数量：671B
显存需求：约 1342GB
硬件建议：需要使用多 GPU 集群，例如 NVIDIA A100 80GB 显卡共 16 张。
平台支持：不支持单台 Mac 电脑，但支持 Mac 电脑集群环境。

蒸馏模型 (Distilled Models)

蒸馏模型通过知识蒸馏，让较小的模型学习较大模型的行为，从而在扩充性能的同时减少资源需求。

适用场景：适合消费级显卡或内存有限的设备。
推荐型号：7B 和 8B 模型可用于 32GB 显存的 Mac，是性能和参数平衡后的最佳选择。

量化模型 (Quantized Models, 4-bit)

量化模型将精度降低至 4bit，大幅降低显存占用。

原理：通过压缩权重减少内存占用，通常伴随微小的精度损失。
优势：相比全参数模型，显存需求可忽略不计，适合个人电脑部署。

2. 电脑端安装指南：Ollama

Ollama 是一款流行的在本地运行大模型的工具，支持 macOS、Windows 和 Linux。

安装步骤

macOS / Linux 打开终端，运行以下命令安装 Ollama：
```
curl -fsSL https://ollama.ai/install.sh | sh
```
Windows 访问 Ollama 官网下载 Windows 安装包，双击运行并按照向导完成安装。

启动服务

安装完成后，Ollama 默认会在本地 11434 端口开启服务。您可以在终端中验证：

ollama list

如果看到已下载的模型列表，说明服务正常。

拉取模型

在终端中搜索并拉取 DeepSeek 模型：

ollama pull deepseek-r1:latest

或者指定具体版本（如 7B）：

ollama pull deepseek-r1:7b

3. 开源大模型 UI 客户端

为了获得更好的交互体验，建议使用图形化界面客户端。

Open WebUI

Open WebUI 支持 Docker 部署，简单方便，功能丰富。

Docker 部署命令：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

本地部署 DeepSeek-R1 模型：电脑与手机方案及硬件需求详解

1. DeepSeek-R1 模型版本说明与硬件需求

全参数模型 (Full Parameters)

蒸馏模型 (Distilled Models)

量化模型 (Quantized Models, 4-bit)

2. 电脑端安装指南：Ollama

安装步骤

启动服务

拉取模型

3. 开源大模型 UI 客户端

Open WebUI

更多推荐文章

相关免费在线工具

Chatbox

4. 安卓手机部署方案

准备工作

操作步骤

5. 常见问题与优化

显存不足怎么办？

推理速度慢？

模型无法加载？

更多推荐文章

相关免费在线工具

本地部署 DeepSeek-R1 模型：电脑与手机方案及硬件需求详解

1. DeepSeek-R1 模型版本说明与硬件需求

全参数模型 (Full Parameters)

蒸馏模型 (Distilled Models)

量化模型 (Quantized Models, 4-bit)

2. 电脑端安装指南：Ollama

安装步骤

启动服务

拉取模型

3. 开源大模型 UI 客户端

Open WebUI

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

Chatbox

4. 安卓手机部署方案

准备工作

操作步骤

5. 常见问题与优化

显存不足怎么办？

推理速度慢？

模型无法加载？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具