LLaMA-Factory 大模型微调实战指南
LLaMA-Factory 是一个简单易用且高效的大型语言模型训练与微调平台。通过它,你可以在无需编写复杂代码的前提下,在本地完成上百种预训练模型的微调。框架支持多种模型架构、丰富的训练算法以及灵活的精度控制。
一、核心特性
- 模型种类:支持 LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等主流模型。
- 训练算法:涵盖(增量)预训练、指令监督微调、奖励模型训练、PPO、DPO、KTO、ORPO 等。
- 运算精度:支持 16 比特全参数微调、冻结微调、LoRA 微调,以及基于 AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ 的 2~8 比特 QLoRA 微调。
- 优化算法:集成 GaLore、BAdam、DoRA、LongLoRA、LoRA+、LoftQ 和 PiSSA 等前沿技术。
- 加速算子:内置 FlashAttention-2 和 Unsloth 支持。
- 推理引擎:兼容 Transformers 和 vLLM。
- 实验监控:支持 LlamaBoard、TensorBoard、Wandb、MLflow、SwanLab 等。
二、安装部署
1. CUDA 环境准备
CUDA 是 NVIDIA 提供的并行计算平台和编程模型。首先确认你的 GPU 是否支持 CUDA,并检查当前 Linux 版本兼容性。
在命令行中输入以下命令查看系统信息:
uname -m && cat /etc/*release
确保输出中包含 x86_64 及对应的 Ubuntu 版本(如 22.04)。接着检查编译器版本:
gcc --version
建议下载 CUDA 12.2 或更高版本。如果之前安装过旧版本(如 12.1),需先卸载。可以使用官方卸载脚本,或者直接删除相关目录并清理包管理器缓存:
sudo rm -r /usr/local/cuda-12.1/
sudo apt clean && sudo apt autoclean
然后运行安装程序,注意在安装过程中取消勾选驱动安装选项,以免版本冲突。安装完成后,输入 nvcc -V 验证版本号。
2. LLaMA-Factory 安装
基础环境推荐配置为:Ubuntu 22.04 + CUDA 12.4 + Python 3.11 + PyTorch 2.x。
创建 Conda 环境并安装核心依赖:
conda create -n llama_factory python=3.10 -y
conda activate llama_factory
conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
克隆项目并安装依赖:
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"


