LLaMA-Factory YAML 配置详解与参数调优实战 | 极客日志

PythonAI算法

LLaMA-Factory YAML 配置详解与参数调优实战

综述由AI生成LLaMA-Factory 的 YAML 配置是微调任务的核心，涵盖模型选择、微调方法、数据处理及训练流程四大模块。通过合理设置 flash_attn、rope_scaling 可提升长文本处理能力，LoRA 秩与学习率的选择直接影响收敛速度与效果。针对显存受限场景，量化与梯度检查点能有效降低资源消耗。梳理了关键参数含义与调试经验，助力开发者快速搭建稳定高效的微调环境。

imJackJia发布于 2026/4/10更新于 2026/5/2213 浏览

LLaMA-Factory 配置文件详解：YAML 参数调优指南

LLaMA-Factory 采用模块化 YAML 配置系统，将微调任务划分为模型、方法、数据集、输出、训练及评估等核心区块。这种结构不仅让参数管理更清晰，也便于不同任务间的配置复用。典型的配置文件大致包含以下部分：

### model # 模型基础配置
### method # 微调方法配置
### dataset # 数据集处理配置
### output # 训练输出配置
### train # 训练过程配置
### eval # 评估相关配置（可选）

项目中提供了大量覆盖从基础 SFT 到高级 RLHF 任务的配置示例。

核心参数详解与调优

模型配置（model）

这里定义基础模型路径及相关技术参数，是微调的基石。关键参数包括：

model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct # 模型路径或 HF 模型 ID
trust_remote_code: true # 是否信任远程代码（自定义模型必需）
rope_scaling: linear # RoPE scaling 策略，解决长文本处理问题
flash_attn: auto # 是否启用 FlashAttention 加速

对于 7B/13B 模型，建议开启 flash_attn: true，通常能提升约 30% 的训练速度。若处理超过 2k tokens 的长文本，记得添加 rope_scaling: linear 和 rope_factor: 2.0。

量化训练时需额外配置量化参数，例如 4-bit 量化：

quantization_method: BNB
quantization_bit: 4
quantization_type: nf4

微调方法配置（method）

这一区块决定微调模式和关键算法参数，直接左右微调效果。LLaMA-Factory 支持多种微调方法，常用配置如下：

stage: sft # 微调阶段：sft/dpo/kto/ppo/pretrain 等
do_train: true # 是否进行训练
finetuning_type: lora

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

微调场景	finetuning_type	lora_rank	推荐硬件
快速原型验证	lora	4-8	12GB 显存
生产级微调	lora	16-32	24GB 显存
全参数微调	full	-	80GB+ 显存
低资源量化	qlora	8-16	8GB 显存

dataset: identity,alpaca_en_demo # 数据集名称，多个用逗号分隔
template: llama3 # 对话模板，需与模型匹配
cutoff_len: 2048 # 文本截断长度
max_samples: 1000 # 最大样本数，用于快速测试
preprocessing_num_workers: 16 # 数据预处理进程数

per_device_train_batch_size: 1 # 单设备批大小
gradient_accumulation_steps: 8 # 梯度累积步数
learning_rate: 1.0e-4 # 学习率
num_train_epochs: 3.0 # 训练轮数
lr_scheduler_type: cosine # 学习率调度策略
warmup_ratio: 0.1 # 预热比例
bf16: true # 是否使用 bf16 混合精度

# 基础内存优化
load_in_4bit: true
gradient_checkpointing: true
# 高级优化（适合 12GB 以下显存）
use_unsloth: true
unsloth_cache_dir: ./cache/unsloth
shift_attn: true # 启用 S^2-Attn 长注意力

# 解决梯度爆炸
max_grad_norm: 1.0
# 解决训练波动
adam_beta2: 0.95
# 数据不平衡处理
class_weight: true
# 学习率预热
warmup_steps: 100

### model
model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
trust_remote_code: true
flash_attn: true
### method
stage: sft
do_train: true
finetuning_type: lora
lora_rank: 16
lora_alpha: 32
lora_dropout: 0.05
### dataset
dataset: alpaca_zh_demo,identity
template: llama3
cutoff_len: 2048
max_samples: 5000
### output
output_dir: saves/llama3-8b/lora/sft
logging_steps: 10
save_steps: 200
plot_loss: true
### train
per_device_train_batch_size: 2
gradient_accumulation_steps: 4
learning_rate: 1.5e-4
num_train_epochs: 3.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
bf16: true

### model
model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
trust_remote_code: true
quantization_method: BNB
quantization_bit: 4
quantization_type: nf4
### method
stage: sft
do_train: true
finetuning_type: lora
lora_rank: 8
lora_target: q_proj,v_proj
### dataset
dataset: alpaca_en_demo
template: llama3
cutoff_len: 1024
max_samples: 2000
### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 8
learning_rate: 2e-4
num_train_epochs: 5.0
gradient_checkpointing: true
use_unsloth: true

python src/train.py --config examples/train_lora/llama3_lora_sft.yaml --dry_run

LLaMA-Factory YAML 配置详解与参数调优实战

LLaMA-Factory 配置文件详解：YAML 参数调优指南

核心参数详解与调优

模型配置（model）

微调方法配置（method）

更多推荐文章

相关免费在线工具

数据集配置（dataset）

训练过程配置（train）

高级调优策略

内存优化配置

训练稳定性优化

配置案例与最佳实践

场景 1：Llama3-8B LoRA 快速微调

场景 2：低资源量化微调（8GB 显存）

配置文件调试与常见问题

配置验证工具

常见错误与解决方法

总结

更多推荐文章

相关免费在线工具

LLaMA-Factory YAML 配置详解与参数调优实战

LLaMA-Factory 配置文件详解：YAML 参数调优指南

核心参数详解与调优

模型配置（model）

微调方法配置（method）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

数据集配置（dataset）

训练过程配置（train）

高级调优策略

内存优化配置

训练稳定性优化

配置案例与最佳实践

场景 1：Llama3-8B LoRA 快速微调

场景 2：低资源量化微调（8GB 显存）

配置文件调试与常见问题

配置验证工具

常见错误与解决方法

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具