LlamaFactory 多模态大模型微调实战指南 | 极客日志

PythonAI算法

LlamaFactory 多模态大模型微调实战指南

本文介绍 LlamaFactory 框架在 Python 环境下的高效安装与使用方法。通过 uv 工具完成依赖管理，利用命令行接口实现模型训练、导出、推理及评估全流程。重点演示了针对 Qwen3-VL 多模态模型的 QLoRA 微调实战，涵盖数据格式配置、YAML 参数调优及训练日志分析。内容去除了无关平台推广信息，聚焦技术细节与实操步骤，适合希望快速上手大模型微调的开发者参考。

dehua dong发布于 2026/4/7更新于 2026/7/234 浏览

LlamaFactory 多模态大模型微调实战指南

LlamaFactory 是一个统一的大模型训练与微调框架，旨在降低大模型定制的技术门槛。它支持全量微调、LoRA、QLoRA 等多种策略，提供 Web UI 和命令行两种交互方式，适合从实验到部署的全流程。

环境安装

推荐使用 uv 工具进行依赖管理，它能快速解决版本冲突问题。

首先克隆项目仓库：

git clone --depth 1 https://github.com/hiyouga/LlamaFactory.git

进入目录并同步环境：

cd LlamaFactory uv sync

验证安装是否成功，启动 Web UI：

uv run llamafactory-cli webui

浏览器访问本地地址，若界面正常加载，说明环境配置无误。

文章配图

命令行基础用法

除了 Web UI，命令行模式更适合自动化脚本和服务器部署。核心命令格式为 llamafactory-cli + 任务 + 配置文件。

常用任务类型包括：

train：训练模型
export：导出合并后的模型
chat：在线推理
eval：评估模型效果

配置文件采用 YAML 格式，官方提供了丰富的示例，涵盖全量训练、LoRA 微调等场景。

训练示例

以 Qwen3 LoRA 微调为例：

model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
stage: sft
do_train: true
finetuning_type: lora
lora_target: all
dataset: identity, alpaca_en_demo
template:

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

uv run llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml

model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
adapter_name_or_path: saves/llama3-8b/lora/sft
template: llama3
finetuning_type: lora
export_dir: models/llama3_lora_sft
export_size: 2
export_device: cpu
export_legacy_format: false

llamafactory-cli export merge_config.yaml

model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
template: llama3
infer_backend: huggingface

llamafactory-cli chat inference_config.yaml

export HF_ENDPOINT="https://hf-mirror.com"

"coco-400": {
  "file_name": "coco-400.json",
  "formatting": "sharegpt",
  "columns": {
    "messages": "conversations",
    "id": "id"
  },
  "tags": {
    "role_tag": "from",
    "content_tag": "value",
    "user_tag": "user",
    "assistant_tag": "assistant"
  }
}

model_name_or_path: Qwen/Qwen3-VL-2B-Instruct
quantization_bit: 4
quantization_method: bnb
trust_remote_code: true

stage: sft
do_train: true
finetuning_type: lora
lora_rank: 8
lora_target: all

dataset: coco-3000
template: qwen3_vl_nothink
cutoff_len: 2048
preprocessing_num_workers: 16
dataloader_num_workers: 4

output_dir: saves/qwen3-2b-coco-3000/lora/sft
logging_steps: 10
save_steps: 500
plot_loss: true
overwrite_output_dir: true
report_to: none

per_device_train_batch_size: 2
gradient_accumulation_steps: 4
learning_rate: 1e-5
num_train_epochs: 2
lr_scheduler_type: cosine
warmup_ratio: 0.1
bf16: true

uv run llamafactory-cli train examples/train_qlora/qwen3-coco.yaml

[INFO|trainer.py] Running training...
Num examples = 600
Num Epochs = 2
Instantaneous batch size per device = 2
Total train batch size (w. parallel) = 8
Gradient Accumulation steps = 4
Total optimization steps = 150

{'loss': 4.3662, 'grad_norm': 5.82, 'learning_rate': 6e-06, 'epoch': 0.13}
{'loss': 4.0005, 'grad_norm': 6.60, 'learning_rate': 9.7e-06, 'epoch': 0.4}
{'loss': 3.1868, 'grad_norm': 3.40, 'learning_rate': 8.5e-06, 'epoch': 0.67}
... loss 持续下降 ...
{'loss': 2.6784, 'grad_norm': 1.99, 'learning_rate': 1.3e-09, 'epoch': 2.0}

Saving model checkpoint to saves/qwen3-2b-coco-3000/lora/sft/checkpoint-150
train_loss = 3.1502
train_runtime = 0:01:33
Figure saved at: saves/qwen3-2b-coco-3000/lora/sft/training_loss.png

LlamaFactory 多模态大模型微调实战指南

LlamaFactory 多模态大模型微调实战指南

环境安装

命令行基础用法

训练示例

更多推荐文章

相关免费在线工具

导出与推理

微调 Qwen3-VL 多模态模型

1. 模型准备

2. 数据准备

3. 参数配置

4. 启动训练

更多推荐文章

相关免费在线工具

LlamaFactory 多模态大模型微调实战指南

LlamaFactory 多模态大模型微调实战指南

环境安装

命令行基础用法

训练示例

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

导出与推理

微调 Qwen3-VL 多模态模型

1. 模型准备

2. 数据准备

3. 参数配置

4. 启动训练

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具