DeepSeek R1 与 Janus-Pro 本地部署高级教程

随着大语言模型技术的快速发展，本地化部署已成为保护数据隐私、降低 API 成本以及离线使用的重要方案。虽然 Ollama 和 LM Studio 等工具提供了一键部署的便捷性，但通过 transformers 库直接加载模型权重的方式提供了更高的灵活性和可控性。

本文将详细介绍如何下载并部署 DeepSeek-R1 及最新的 Janus-Pro 多模态模型。该方法基于 Hugging Face Transformers 生态，理论上支持所有兼容该框架的模型。尽管相比 VLLM 或 SGLang 等专用推理框架，其推理速度可能稍慢，但其通用性和调试便利性使其成为学习和研究的首选方案。

一、环境准备与硬件要求

在开始部署之前，请确保您的开发环境满足以下基本要求：

1. 硬件配置

GPU: 推荐使用 NVIDIA 显卡，显存大小直接决定可部署的模型规模。
- Janus-Pro-1B: 约需 8GB 显存（FP16）。
- DeepSeek-R1 (32B): 建议至少 32GB 显存（FP16），若使用量化版本可降低至 16GB 左右。
内存: 系统内存建议 32GB 以上，以防模型加载时发生 OOM（Out Of Memory）错误。
存储: 预留 50GB 以上的 SSD 空间用于存放模型权重文件。

2. 软件环境

操作系统: Windows 10/11, Linux (Ubuntu 20.04+), macOS。
Python: 推荐 Python 3.9 或 3.10。
CUDA: 根据 PyTorch 版本匹配对应的 CUDA Toolkit（如 CUDA 11.8 或 12.1）。
Git: 用于克隆模型仓库和下载大文件。

二、模型下载

国内用户推荐使用 ModelScope（魔搭社区）进行模型权重下载，网络稳定性优于 Hugging Face。

1. 访问模型页面

访问 DeepSeek 官方组织页面：https://www.modelscope.cn/organization/deepseek-ai

在该页面中，您可以找到 DeepSeek-R1 系列以及 Janus-Pro 系列模型。两者的下载流程基本一致。

2. 使用 Git LFS 下载

由于模型文件较大，建议使用 Git LFS（Large File Storage）进行下载。

安装 Git LFS:

git lfs install

克隆模型仓库: 以 Janus-Pro-1B 为例：

git clone https://www.modelscope.cn/deepseek-ai/Janus-Pro-1B.git

执行上述命令后，本地将生成一个包含模型权重的文件夹。等待下载完成即可进入下一步。

三、环境配置

1. 获取项目代码

Janus-Pro 需要配合官方提供的推理代码使用。请访问 GitHub 仓库：https://github.com/deepseek-ai/Janus

点击右上角的 "Code" 按钮，选择 "Download ZIP" 下载源码包，解压至本地目录。

2. 安装依赖

进入项目根目录，创建虚拟环境（可选但推荐）：

DeepSeek R1 与 Janus-Pro 本地部署高级教程