1. 概述
本文介绍如何在个人电脑上使用 LLaMA-Factory 工具微调 DeepSeek-R1 1.5B 大模型。环境配置基于 NVIDIA GeForce RTX 3050 Ti Laptop GPU,适合具备一定基础的开发者尝试私有化大模型训练。
2. 训练模型
2.1 基础配置
安装以下必要工具:
- Anaconda(Python 环境管理工具)
- PyCharm(Python 集成开发环境)
- Git(分布式版本控制系统)
- CUDA 和 cuDNN(GPU 训练加速,注意版本匹配)
- PyTorch(深度学习框架,需与 CUDA 版本对应)
2.2 初始化环境
打开 Anaconda Prompt,执行以下命令创建并激活虚拟环境:
conda create -n llama python=3.10
conda activate llama
安装 PyTorch(示例为 CUDA 12.4,请根据实际选择):
conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=12.4 -c pytorch -c nvidia
克隆 GitHub 项目:
git clone https://github.com/hiyouga/LLaMA-Factory.git
或直接下载压缩包并在 PyCharm 中打开。安装依赖时建议添加镜像源:
pip install -e ".[torch,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple/
验证安装:
llamafactory-cli version
2.3 下载大模型
修改环境变量以指定 Hugging Face 下载路径及镜像源:
$env:HF_HOME = "E:\soft\Hugging-Face"
$env:HF_ENDPOINT = "https://hf-mirror.com"
安装 huggingface_hub:


