一、安装 PyTorch
1. 检查 GPU 计算能力
在开始微调之前,首先需要确认 GPU 的计算能力,因为不同架构的 GPU 对 PyTorch 版本有不同要求。
nvidia-smi --query-gpu=compute_cap --format=csv
2. 匹配 PyTorch 版本
根据 GPU 计算能力选择合适的 PyTorch 版本:
- 计算能力 < 7.0 (如 Maxwell 架构):使用较老版本
- 计算能力 7.x (Volta/Turing):PyTorch 1.8+
- 计算能力 8.x (Ampere):PyTorch 1.10+
- 计算能力 9.x (Ada Lovelace):PyTorch 2.0+
3. 重新安装合适版本的 PyTorch
如果当前安装的 PyTorch 版本与 GPU 计算能力不匹配,需要重新安装合适版本。
# 卸载当前版本
pip uninstall torch torchvision torchaudio
# 安装新版本 (参考官网命令)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
二、安装 LLaMA-Factory
1. LLaMA-Factory
LLaMA-Factory 是一个专门用于微调大语言模型的工具包。
git clone -b v0.8.1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .[torch,metrics]
2. unsloth 的显存优化机制
为了降低显存占用,建议安装 liger_kernel 0.5.2 版本。
pip install liger-kernel==0.5.2
三、下载模型
模型下载是微调过程中的关键步骤,需确保下载正确的模型文件和权重。
# 模型安装目录示例
/data/models/Qwen/Qwen2.5-7B-Instruct
建议使用 Git LFS 管理大文件。Qwen2.5-7B-Instruct 适合进行进一步的领域适配微调。
四、数据集
1. 内置数据集
LLaMA-Factory 提供了内置的数据集支持。
- 准备数据集文件,json 格式,存放到 data 目录下。
- 注册数据集,将 json 文件注册到 data 目录下的 dataset_info.json 文件。
- 使用内置 identity 数据集,用于修改模型的自我意识。
- 替换 identity.json 里面的占位符。
sed -i 's/{{name}}/XX 智能助手/g; s/{{author}}/XX 科技/g' data/identity.json
2. 数据集注册
对于非内置数据集,需要在 dataset_info.json 文件中添加数据集的元信息,包括文件路径、格式说明等。
五、微调
1. 基本
基本微调配置提供了最基础的训练参数设置。


