LLaMA-Factory 配置文件详解:YAML 参数调优指南
LLaMA-Factory 采用模块化 YAML 配置系统,将微调任务划分为模型、方法、数据集、输出、训练及评估等核心区块。这种结构不仅让参数管理更清晰,也便于不同任务间的配置复用。典型的配置文件大致包含以下部分:
### model # 模型基础配置
### method # 微调方法配置
### dataset # 数据集处理配置
### output # 训练输出配置
### train # 训练过程配置
### eval # 评估相关配置(可选)
项目中提供了大量覆盖从基础 SFT 到高级 RLHF 任务的配置示例。
核心参数详解与调优
模型配置(model)
这里定义基础模型路径及相关技术参数,是微调的基石。关键参数包括:
model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct # 模型路径或 HF 模型 ID
trust_remote_code: true # 是否信任远程代码(自定义模型必需)
rope_scaling: linear # RoPE scaling 策略,解决长文本处理问题
flash_attn: auto # 是否启用 FlashAttention 加速
对于 7B/13B 模型,建议开启 flash_attn: true,通常能提升约 30% 的训练速度。若处理超过 2k tokens 的长文本,记得添加 rope_scaling: linear 和 rope_factor: 2.0。
量化训练时需额外配置量化参数,例如 4-bit 量化:
quantization_method: BNB
quantization_bit: 4
quantization_type: nf4
微调方法配置(method)
这一区块决定微调模式和关键算法参数,直接左右微调效果。LLaMA-Factory 支持多种微调方法,常用配置如下:
stage: sft # 微调阶段:sft/dpo/kto/ppo/pretrain 等
do_train: true # 是否进行训练
finetuning_type: lora

