1. 前言
本教程介绍如何在个人电脑上使用 LLaMA-Factory 框架对 DeepSeek-R1 大模型进行微调。环境配置需具备 NVIDIA GPU,建议显存充足。
2. 训练模型
2.1 基础配置
- Anaconda:Python 环境管理工具。
- PyCharm:Python 集成开发环境。
- Git:版本控制系统,用于克隆项目。
- CUDA 和 cuDNN:GPU 加速驱动,注意版本匹配。
- PyTorch:深度学习框架,版本需与 CUDA 对应。
2.2 初始化环境
打开 Anaconda Prompt,创建并激活虚拟环境:
conda create -n llama python=3.10
conda activate llama
安装 PyTorch(示例为 CUDA 12.4):
conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=12.4 -c pytorch -c nvidia
克隆 LLaMA-Factory 项目:
git clone https://github.com/hiyouga/LLaMA-Factory.git
进入项目目录安装依赖(建议使用镜像源):
pip install -e "[torch,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple/
验证安装:
llamafactory-cli version
2.3 下载大模型
设置环境变量以修改 HuggingFace 下载路径(PowerShell):
echo $env:HF_HOME ="E:\soft\Hugging-Face"
echo $env:HF_ENDPOINT="https://hf-mirror.com"
安装 huggingface_hub:
pip install -U huggingface_hub
下载模型:


