LlamaFactory 多模态大模型微调实战指南 | 极客日志

PythonAI算法

LlamaFactory 多模态大模型微调实战指南

LlamaFactory 是一款高效的大模型微调框架，支持 WebUI 与命令行双模式。基于 uv 的安装流程，涵盖训练、导出、推理及评估的核心命令。重点演示了 Qwen3-VL 多模态模型的 QLoRA 微调实战，包括国内镜像源配置、ShareGPT 数据集注册、关键参数调整及训练日志解读，帮助开发者快速上手定制化模型部署。

2177283801发布于 2026/4/7更新于 2026/7/530 浏览

LlamaFactory 多模态大模型微调实战指南

文章配图

LlamaFactory 是一个面向科研、企业及开发者的全栈式大模型训练与微调框架。它通过集成化工具链和可视化界面，显著降低了定制优化的技术门槛，支持从开发调试到生产部署的全周期闭环。

官方文档： https://llamafactory.readthedocs.io/zh-cn/latest/

安装环境

推荐使用 uv 工具进行依赖管理，它能快速完成版本锁定与环境同步。

首先克隆项目仓库：

git clone --depth 1 https://github.com/hiyouga/LlamaFactory.git

进入目录并同步依赖：

cd LlamaFactory uv sync

验证安装是否成功，启动 WebUI：

uv run llamafactory-cli webui

文章配图

若页面正常加载，说明环境配置无误。

命令行基础用法

除了 WebUI，命令行模式更适合自动化脚本或服务器部署。主要涵盖训练、导出、推理与评估四大核心功能。

通用命令格式为：

llamafactory-cli <任务类型> <配置文件路径>

常见任务类型包括：

train：模型训练
export：权重导出
chat：在线推理
eval：性能评估

配置文件采用 YAML 格式，清晰定义了模型参数、数据集及训练策略。官方提供了丰富的示例，覆盖全量训练、LoRA 及 QLoRA 等主流微调方案。

训练示例

以 LoRA 微调为例：

uv run llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml

配置文件内容参考：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

llamafactory-cli export merge_config.yaml

model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
template: llama3
infer_backend: huggingface

llamafactory-cli chat inference_config.yaml

llamafactory-cli eval examples/train_lora/llama3_lora_eval.yaml

export HF_ENDPOINT="https://hf-mirror.com"

[{"instruction":"...","input":"...","output":"..."}]

[{"messages":[{"content":"...","role":"user"}], "audios": ["..."]}]

"coco-400": {
  "file_name": "coco-400.json",
  "formatting": "sharegpt",
  "columns": {"messages": "conversations", "id": "id"},
  "tags": {"role_tag": "from", "content_tag": "value", "user_tag": "user", "assistant_tag": "assistant"}
}

model_name_or_path: Qwen/Qwen3-VL-2B-Instruct
quantization_bit: 4
quantization_method: bnb
trust_remote_code: true

stage: sft
do_train: true
finetuning_type: lora
lora_rank: 8
lora_target: all

dataset: coco-3000
template: qwen3_vl_nothink
cutoff_len: 2048
max_samples: 1000
preprocessing_num_workers: 16
dataloader_num_workers: 4

output_dir: saves/qwen3-2b-coco-3000/lora/sft
logging_steps: 10
save_steps: 500
plot_loss: true
overwrite_output_dir: true
report_to: none

per_device_train_batch_size: 2
gradient_accumulation_steps: 4
learning_rate: 1e-5
num_train_epochs: 2
lr_scheduler_type: cosine
warmup_ratio: 0.1
bf16: true
ddp_timeout: 180000000

uv run llamafactory-cli train examples/train_qlora/qwen3-coco.yaml

LlamaFactory 多模态大模型微调实战指南

LlamaFactory 多模态大模型微调实战指南

安装环境

命令行基础用法

训练示例

更多推荐文章

相关免费在线工具

导出与推理

评估

微调 Qwen3-VL 实战

模型准备

数据准备

参数配置

启动训练

更多推荐文章

相关免费在线工具

LlamaFactory 多模态大模型微调实战指南

LlamaFactory 多模态大模型微调实战指南

安装环境

命令行基础用法

训练示例

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

导出与推理

评估

微调 Qwen3-VL 实战

模型准备

数据准备

参数配置

启动训练

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具