LLaMA Factory 大模型微调实战指南

LLaMA-Factory 简介

LLaMA-Factory 是一个简单易用且高效的大型语言模型训练与微调平台。通过它，可以在无需编写大量代码的前提下，在本地完成上百种预训练模型的微调。其核心特性包括支持多种主流模型架构（如 LLaMA、Qwen、Yi、ChatGLM 等）、丰富的训练算法（SFT、DPO、PPO 等）以及灵活的精度控制（全参数、LoRA、QLoRA 等）。此外，框架还集成了 FlashAttention-2、Unsloth 等加速算子，并支持 TensorBoard、Wandb 等实验监控工具。

安装部署

CUDA 环境配置

CUDA 是 NVIDIA 提供的并行计算平台和编程模型。首先需确认 GPU 是否支持 CUDA，可通过官方文档查询兼容列表。在 Linux 环境下，建议先检查系统版本和编译器环境：

uname -m && cat /etc/*release
gcc --version

确保输出符合预期后，下载并安装 CUDA Toolkit（推荐 12.2 版本）。若之前已安装旧版本，需先卸载：

sudo /usr/local/cuda-12.1/bin/cuda-uninstaller
# 若命令不可用，可手动清理
sudo rm -r /usr/local/cuda-12.1/
sudo apt clean && sudo apt autoclean

安装完成后，运行 nvcc -V 验证版本号。注意在安装过程中，若不确定驱动兼容性，建议取消 Driver 的自动安装选项。

LLaMA-Factory 安装

基础环境建议如下：Ubuntu 22.04 + CUDA 12.x + Python 3.10 + PyTorch 2.2.2。

创建虚拟环境并安装依赖：

conda create -n llama_factory python=3.10 -y
conda activate llama_factory
conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install llmtuner

克隆项目并安装依赖：

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

若遇到依赖冲突，可尝试 pip install --no-deps -e . 跳过依赖检查。安装成功后，可通过以下命令校验：

llamafactory-cli version

启动 WebUI 界面：

CUDA_VISIBLE_DEVICES=0 GRADIO_SHARE=1 GRADIO_SERVER_PORT=7860 llamafactory-cli webui

如需使用离线模型，可从 ModelScope 等平台下载，例如：

git clone https://www.modelscope.cn/Qwen/Qwen2.5-0.5B-Instruct.git

Windows 用户注意事项

Windows 环境下启用 QLoRA 或 FlashAttention-2 可能需要特定版本的二进制包。请根据 CUDA 版本从 GitHub 发布页下载对应的文件进行安装。此外，部分高级功能（如 DeepSpeed、vLLM）可能需要额外安装依赖项。

参数	说明
`model_name_or_path`	模型名称或路径
`stage`	训练阶段 (pt/sft/rm/dpo/kto/orpo)
`finetuning_type`	微调方式 (freeze/lora/full)
`lora_target`	LoRA 目标模块，默认 all
`dataset`	数据集名称，逗号分隔多个
`template`	模型模板，需与模型匹配
`learning_rate`	学习率
`num_train_epochs`	训练轮数
`bf16`	是否启用 bf16 混合精度

LLaMA Factory 大模型微调实战指南

LLaMA-Factory 简介

安装部署

CUDA 环境配置

LLaMA-Factory 安装

Windows 用户注意事项

更多推荐文章

相关免费在线工具

数据微调准备

指令监督微调

其他数据集类型

WebUI 操作指南

SFT 命令行训练

LoRA 合并与量化

推理与评估

推理配置

模型评估

更多推荐文章

相关免费在线工具

LLaMA Factory 大模型微调实战指南

LLaMA-Factory 简介

安装部署

CUDA 环境配置

LLaMA-Factory 安装

Windows 用户注意事项

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

数据微调准备

指令监督微调

其他数据集类型

WebUI 操作指南

SFT 命令行训练

LoRA 合并与量化

推理与评估

推理配置

模型评估

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具