DeepSeek R1 与 Janus-Pro 本地部署高级教程
随着大语言模型技术的快速发展,本地化部署已成为保护数据隐私、降低 API 成本以及离线使用的重要方案。虽然 Ollama 和 LM Studio 等工具提供了一键部署的便捷性,但通过 transformers 库直接加载模型权重的方式提供了更高的灵活性和可控性。
本文将详细介绍如何下载并部署 DeepSeek-R1 及最新的 Janus-Pro 多模态模型。该方法基于 Hugging Face Transformers 生态,理论上支持所有兼容该框架的模型。尽管相比 VLLM 或 SGLang 等专用推理框架,其推理速度可能稍慢,但其通用性和调试便利性使其成为学习和研究的首选方案。
一、环境准备与硬件要求
在开始部署之前,请确保您的开发环境满足以下基本要求:
1. 硬件配置
- GPU: 推荐使用 NVIDIA 显卡,显存大小直接决定可部署的模型规模。
- Janus-Pro-1B: 约需 8GB 显存(FP16)。
- DeepSeek-R1 (32B): 建议至少 32GB 显存(FP16),若使用量化版本可降低至 16GB 左右。
- 内存: 系统内存建议 32GB 以上,以防模型加载时发生 OOM(Out Of Memory)错误。
- 存储: 预留 50GB 以上的 SSD 空间用于存放模型权重文件。
2. 软件环境
- 操作系统: Windows 10/11, Linux (Ubuntu 20.04+), macOS。
- Python: 推荐 Python 3.9 或 3.10。
- CUDA: 根据 PyTorch 版本匹配对应的 CUDA Toolkit(如 CUDA 11.8 或 12.1)。
- Git: 用于克隆模型仓库和下载大文件。
二、模型下载
国内用户推荐使用 ModelScope(魔搭社区)进行模型权重下载,网络稳定性优于 Hugging Face。
1. 访问模型页面
访问 DeepSeek 官方组织页面:https://www.modelscope.cn/organization/deepseek-ai
在该页面中,您可以找到 DeepSeek-R1 系列以及 Janus-Pro 系列模型。两者的下载流程基本一致。
2. 使用 Git LFS 下载
由于模型文件较大,建议使用 Git LFS(Large File Storage)进行下载。
安装 Git LFS:
git lfs install
克隆模型仓库: 以 Janus-Pro-1B 为例:
git clone https://www.modelscope.cn/deepseek-ai/Janus-Pro-1B.git
执行上述命令后,本地将生成一个包含模型权重的文件夹。等待下载完成即可进入下一步。
三、环境配置
1. 获取项目代码
Janus-Pro 需要配合官方提供的推理代码使用。请访问 GitHub 仓库:https://github.com/deepseek-ai/Janus
点击右上角的 "Code" 按钮,选择 "Download ZIP" 下载源码包,解压至本地目录。
2. 安装依赖
进入项目根目录,创建虚拟环境(可选但推荐):


