Qwen3 模型 LoRA 微调实战（基于 LLaMA-Factory） | 极客日志

PythonAI算法

Qwen3 模型 LoRA 微调实战（基于 LLaMA-Factory）

介绍使用 LLaMA-Factory 框架对 Qwen3 大模型进行 LoRA 指令微调的完整流程。内容包括开发环境搭建、数据集格式说明（Alpaca、ShareGPT 及自定义）、命令行与可视化界面微调操作，以及常见错误排查（如 CUDA 版本、bf16 支持等）。旨在帮助开发者快速上手本地化模型训练。

接口猎人发布于 2026/4/5更新于 2026/5/2740 浏览

AI 大模型微调：Qwen3 模型 LoRA 微调（基于 LLaMA-Factory）

一、安装 LLaMA-Factory 及开发环境

开源项目地址：https://github.com/hiyouga/LLaMA-Factory
文档：https://llamafactory.readthedocs.io/zh-cn/latest/

# 创建新开发环境
conda create -n llama_factory_Qwen3 python=3.11 -y
conda activate llama_factory_Qwen3

# 下载项目并安装
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

若 git 克隆失败，可清理 DNS 缓存后重试：

ipconfig /flushdns

二、数据集准备

dataset_info.json 包含了所有经过预处理的本地数据集以及在线数据集。如果您希望使用自定义数据集，请务必在该文件中添加对数据集及其内容的定义。目前项目支持 Alpaca 格式和 ShareGPT 格式的数据集。

1. Alpaca 格式

指令监督微调 (Instruct Tuning) 通过让模型学习详细的指令以及对应的回答来优化模型在特定指令下的表现。instruction 列对应人类指令，input 列对应人类输入，output 列对应模型回答。

示例：

{"instruction":"计算这些物品的总费用。","input":"输入：汽车 - $3000，衣服 - $100，书 - $20。","output":"汽车、衣服和书的总费用为 $3000 + $100 + $20 = $3120。"}

在进行指令监督微调时，instruction 与 input 拼接后作为最终的人类输入，即 instruction\ninput。output 为模型回答。若指定 system 列，将作为系统提示词。history 列是由多个字符串二元组构成的列表，代表历史消息。

格式要求：

[{

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

"数据集名称":{"file_name":"data.json","columns":{"prompt":"instruction","query":"input","response":"output","system":"system","history":"history"}}

{"conversations":[{"from":"human","value":"你好，我出生于 1990 年 5 月 15 日。你能告诉我今天几岁了吗？"},{"from":"function_call","value":"{\"name\": \"calculate_age\", \"arguments\": {\"birthdate\": \"1990-05-15\"}}"},{"from":"observation","value":"{\"age\": 31}"},{"from":"gpt","value":"根据我的计算，你今天 31 岁了。"}],"tools":"[{\"name\": \"calculate_age\", \"description\": \"根据出生日期计算年龄\", \"parameters\": {\"type\": \"object\"}}]"}

"数据集名称":{"file_name":"data.json","formatter":"sharegpt","columns":{"messages":"conversations","system":"system","tools":"tools"}}

{"content":"类型#裤*版型#宽松*风格#性感*图案#线条*裤型#阔腿裤","summary":"宽松的阔腿裤这两年真的吸粉不少..."}

{"adgen_local":{"file_name":"AdvertiseGen/train.json","columns":{"prompt":"content","response":"summary"}}}

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \
--stage sft \
--do_train \
--model_name_or_path <local_model_path> \
--dataset alpaca_gpt4_zh,identity,adgen_local \
--dataset_dir ./data \
--template qwen3 \
--finetuning_type lora \
--output_dir <local_lora_save_path> \
--overwrite_cache \
--overwrite_output_dir \
--cutoff_len 1024 \
--preprocessing_num_workers 16 \
--per_device_train_batch_size 2 \
--per_device_eval_batch_size 1 \
--gradient_accumulation_steps 8 \
--lr_scheduler_type cosine \
--logging_steps 50 \
--warmup_steps 20 \
--save_steps 100 \
--eval_steps 50 \
--evaluation_strategy steps \
--load_best_model_at_end \
--learning_rate 5e-5 \
--num_train_epochs 5.0 \
--max_samples 1000 \
--val_size 0.1 \
--plot_loss \
--fp16

# 开启可视化操作界面
set CUDA_VISIBLE_DEVICES=0
llamafactory-cli webui

Qwen3 模型 LoRA 微调实战（基于 LLaMA-Factory）

AI 大模型微调：Qwen3 模型 LoRA 微调（基于 LLaMA-Factory）

一、安装 LLaMA-Factory 及开发环境

二、数据集准备

1. Alpaca 格式

更多推荐文章

相关免费在线工具

2. ShareGPT 格式

3. 自定义数据集

三、LoRA 指令微调（命令行）

四、可视化/零代码微调

1. 模型下载源

2. 微调方法

3. 数据集

4. 计算类型

5. 模型名称

6. 导出微调过的模型

五、常见问题排查

1. CUDA 未找到

2. ValueError: Your setup doesn't support bf16/gpu

总结

更多推荐文章

相关免费在线工具

Qwen3 模型 LoRA 微调实战（基于 LLaMA-Factory）

AI 大模型微调：Qwen3 模型 LoRA 微调（基于 LLaMA-Factory）

一、安装 LLaMA-Factory 及开发环境

二、数据集准备

1. Alpaca 格式

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. ShareGPT 格式

3. 自定义数据集

三、LoRA 指令微调（命令行）

四、可视化/零代码微调

1. 模型下载源

2. 微调方法

3. 数据集

4. 计算类型

5. 模型名称

6. 导出微调过的模型

五、常见问题排查

1. CUDA 未找到

2. ValueError: Your setup doesn't support bf16/gpu

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具