LlamaFactory 多模态大模型微调实战指南

LlamaFactory 是一个面向科研、企业及开发者的全栈式大模型训练与微调框架。它通过集成化工具链和可视化界面,显著降低了定制优化的技术门槛,支持从开发调试到生产部署的全周期闭环。
官方文档: https://llamafactory.readthedocs.io/zh-cn/latest/
安装环境
推荐使用 uv 工具进行依赖管理,它能快速完成版本锁定与环境同步。
首先克隆项目仓库:
git clone --depth 1 https://github.com/hiyouga/LlamaFactory.git
进入目录并同步依赖:
cd LlamaFactory uv sync
验证安装是否成功,启动 WebUI:
uv run llamafactory-cli webui


若页面正常加载,说明环境配置无误。
命令行基础用法
除了 WebUI,命令行模式更适合自动化脚本或服务器部署。主要涵盖训练、导出、推理与评估四大核心功能。
通用命令格式为:
llamafactory-cli <任务类型> <配置文件路径>
常见任务类型包括:
train:模型训练export:权重导出chat:在线推理eval:性能评估
配置文件采用 YAML 格式,清晰定义了模型参数、数据集及训练策略。官方提供了丰富的示例,覆盖全量训练、LoRA 及 QLoRA 等主流微调方案。
训练示例
以 LoRA 微调为例:
uv run llamafactory-cli train examples/train_lora/qwen3_lora_sft.yaml
配置文件内容参考:







