Qwen3 模型 LoRA 微调实战：使用 LLaMA-Factory | 极客日志

PythonAI算法

Qwen3 模型 LoRA 微调实战：使用 LLaMA-Factory

使用 LLaMA-Factory 框架对 Qwen3 大模型进行 LoRA 指令微调的完整流程。内容涵盖开发环境安装、数据集格式规范（包括 Alpaca、ShareGPT 及自定义格式）、命令行与可视化界面的训练操作，以及常见问题解决方案。通过配置 dataset_info.json 注册数据并调整超参数，可实现高效的模型适配与优化。

PentesterX发布于 2026/4/6更新于 2026/5/2343 浏览

Qwen3 模型 LoRA 微调实战：使用 LLaMA-Factory

一、安装 LLaMA-Factory 及开发环境

开源项目地址：https://github.com/hiyouga/LLaMA-Factory 文档：https://llamafactory.readthedocs.io/zh-cn/latest/

# 创建新开发环境
conda create -n llama_factory_Qwen3 python=3.11 -y
conda activate llama_factory_Qwen3

# 下载项目并安装
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

在 git 失败时，清理 DNS 缓存，然后继续：

ipconfig /flushdns

二、数据集

dataset_info.json 包含了所有经过预处理的本地数据集以及在线数据集。如果您希望使用自定义数据集，请务必在 dataset_info.json 文件中添加对数据集及其内容的定义。目前项目支持 Alpaca 格式和 ShareGPT 格式的数据集。

1. Alpaca

指令监督微调 (Instruct Tuning) 通过让模型学习详细的指令以及对应的回答来优化模型在特定指令下的表现。instruction 列对应的内容为人类指令，input 列对应的内容为人类输入，output 列对应的内容为模型回答。下面是一个例子：

{"instruction":"计算这些物品的总费用。","input":"输入：汽车 - $3000，衣服 - $100，书 - $20。","output":"汽车、衣服和书的总费用为 $3000 + $100 + $20 = $3120。"}

在进行指令监督微调时，instruction 列对应的内容会与 input 列对应的内容拼接后作为最终的人类输入，即人类输入为 instruction\ninput。而 output 列对应的内容为模型回答。如果指定 system 列对应的内容将被作为系统提示词。history 列是由多个字符串二元组构成的列表，分别代表历史消息中每轮对话的指令和回答。

指令监督微调数据集的最终格式要求如下:

[{"instruction":"人类指令（必填）"

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

"数据集名称":{"file_name":"data.json","columns":{"prompt":"instruction","query":"input","response":"output","system":"system","history":"history"}}

{"conversations":[{"from":"human","value":"你好，我出生于 1990 年 5 月 15 日。你能告诉我今天几岁了吗？"},{"from":"function_call","value":"{\"name\": \"calculate_age\", \"arguments\": {\"birthdate\": \"1990-05-15\"}}"},{"from":"observation","value":"{\"age\": 31}"},{"from":"gpt","value":"根据我的计算，你今天 31 岁了。"}],"tools":"[{\"name\": \"calculate_age\", \"description\": \"根据出生日期计算年龄\", \"parameters\": {\"type\": \"object\"}}]"

"数据集名称":{"file_name":"data.json","formatter":"sharegpt","columns":{"messages":"conversations","system":"system","tools":"tools"}}

{"content":"类型#裤*版型#宽松*风格#性感*图案#线条*裤型#阔腿裤","summary":"宽松的阔腿裤这两年真的吸粉不少，明星时尚达人的心头爱。毕竟好穿时尚，谁都能穿出腿长 2 米的效果宽松的裤腿，当然是遮肉小能手啊。上身便..."}

{"adgen_local":{"file_name":"AdvertiseGen/train.json","columns":{"prompt":"content","response":"summary"}}}

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \
--stage sft \
--do_train \
--model_name_or_path <local_model_path> \
--dataset alpaca_gpt4_zh,identity,adgen_local \
--dataset_dir ./data \
--template qwen3 \
--finetuning_type lora \
--output_dir <local_lora_save_path> \
--overwrite_cache \
--overwrite_output_dir \
--cutoff_len 1024 \
--preprocessing_num_workers 16 \
--per_device_train_batch_size 2 \
--per_device_eval_batch_size 1 \
--gradient_accumulation_steps 8 \
--lr_scheduler_type cosine \
--logging_steps 50 \
--warmup_steps 20 \
--save_steps 100 \
--eval_steps 50 \
--evaluation_strategy steps \
--load_best_model_at_end \
--learning_rate 5e-5 \
--num_train_epochs 5.0 \
--max_samples 1000 \
--val_size 0.1 \
--plot_loss \
--fp16

# 开启可视化操作界面
set CUDA_VISIBLE_DEVICES=0
llamafactory-cli webui

Qwen3 模型 LoRA 微调实战：使用 LLaMA-Factory

Qwen3 模型 LoRA 微调实战：使用 LLaMA-Factory

一、安装 LLaMA-Factory 及开发环境

二、数据集

1. Alpaca

更多推荐文章

相关免费在线工具

2. ShareGPT

3. 自定义数据集

三、LoRA 指令微调

四、可视化/零代码微调

1. 模型下载源

2. 微调方法

3. Train-数据集

4. Train-计算类型

5. 模型名称

6. 导出微调过的模型

五、可能出现的问题

1. CUDA 未找到

2. ValueError: Your setup doesn't support bf16/gpu.

总结

更多推荐文章

相关免费在线工具

Qwen3 模型 LoRA 微调实战：使用 LLaMA-Factory

Qwen3 模型 LoRA 微调实战：使用 LLaMA-Factory

一、安装 LLaMA-Factory 及开发环境

二、数据集

1. Alpaca

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. ShareGPT

3. 自定义数据集

三、LoRA 指令微调

四、可视化/零代码微调

1. 模型下载源

2. 微调方法

3. Train-数据集

4. Train-计算类型

5. 模型名称

6. 导出微调过的模型

五、可能出现的问题

1. CUDA 未找到

2. ValueError: Your setup doesn't support bf16/gpu.

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具