LLaMA-Factory 微调 Qwen3-VL 详细流程
目标:本文详细介绍多模态大模型使用 LLaMA-Factory 进行多模态模型微调(SFT)的全部流程,以及微调后合并和工业落地部署方案。具体包括:
- 环境安装部署
- 数据集准备
- 启动微调
- 模型合并
- 模型部署和请求方式 (vllm 部署)
示例模型:Qwen2.5-VL-Instruct, Qwen3-VL-Instruct
环境安装
LLaMA-Factory 环境准备
方式 1 Git 直接下载
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
方式 2 下载项目压缩包再解压
(此处省略图片说明)
Python 环境安装
- Python 虚拟环境创建
- conda create --name llama_env python=3.12 (默认已安装好 Anaconda 或者 Miniconda)
- conda activate llama_env # 进入虚拟环境
- 安装依赖包
- cd LLaMA-Factory-main # 进入项目目录
- pip install -e ".[torch,metrics]" --no-build-isolation -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/
下载模型
从 ModelScope 或者 HuggingFace 下载模型到指定目录。比如 Qwen3-VL。
- 在当前项目目录打开 CMD
- 输入
modelscope download --model Qwen/Qwen3-VL-2B-Instruct --local_dir ./qwen3_vl_model将模型下载到 models 目录下。
启动训练(命令行)
在 Linux 系统上,一般直接使用命令行进行训练、合并、部署。
LoRA 微调步骤-SFT 任务
先使用默认数据集测试微调流程
在 LLaMA-Factory-main 目录下:
执行 CUDA_VISIBLE_DEVICES=6 llamafactory-cli train examples/train_lora/qwen2_5vl_lora_sft.yaml 开始训练画面。
编辑配置文件 vim examples/train_lora/qwen2_5vl_lora_sft.yaml:
### model
model_name_or_path: /data/hcb/LLaMA-Factory-main/qwen3_vl_model # 模型路径
image_max_pixels: 262144
video_max_pixels: 16384
trust_remote_code:


