Qwen 大模型基于 QLoRA 的微调实战指南

Qwen 大模型基于 QLoRA 的微调实战指南 | 极客日志

git clone https://github.com/yangjianxin/Firefly.git
cd Firefly
pip install -r requirements.txt

{
    "output_dir": "output/firefly-qwen-1_8b-sft-qlora",
    "model_name_or_path": "Qwen/Qwen-1_8B-Chat",
    "train_file": "./data/dummy_data.jsonl",
    "template_name": "qwen",
    "num_train_epochs": 1,
    "per_device_train_batch_size": 1,
    "gradient_accumulation_steps": 16,
    "learning_rate": 2e-4,
    "max_seq_length": 1024,
    "logging_steps": 100,
    "save_steps": 100,
    "save_total_limit": 1,
    "lr_scheduler_type": "constant_with_warmup",
    "warmup_steps": 100,
    "lora_rank": 64,
    "lora_alpha": 128,
    "lora_dropout": 0.05,
    "gradient_checkpointing": true,
    "disable_tqdm": false,
    "optim": "paged_adamw_32bit",
    "seed": 42,
    "fp16": true,
    "report_to": "tensorboard",
    "dataloader_num_workers": 0,
    "save_strategy": "steps",
    "weight_decay": 0,
    "max_grad_norm": 0.3,
    "remove_unused_columns": false
}

import json
import csv

# 假设原始数据为 csv 格式，包含 question, answer 列
with open('raw_data.csv', 'r', encoding='utf-8') as f_in, \
     open('./data/custom_data.jsonl', 'w', encoding='utf-8') as f_out:
    reader = csv.DictReader(f_in)
    for i, row in enumerate(reader):
        data = {
            "conversation_id": i,
            "conversation": [
                {"human": row['question'], "assistant": row['answer']}
            ]
        }
        f_out.write(json.dumps(data, ensure_ascii=False) + '\n')

python train.py --train_args_file train_args/sft/qlora/qwen-7b-sft-qlora.json

from firefly.trainer.sft_trainer import SFTTrainer
from peft import PeftModel
from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载基础模型
base_model = AutoModelForCausalLM.from_pretrained(
    "Qwen/Qwen-1_8B-Chat",
    load_in_8bit=True,
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-1_8B-Chat", use_fast=False)

# 加载微调后的 LoRA 权重
model = PeftModel.from_pretrained(base_model, "output/firefly-qwen-1_8b-sft-qlora")

# 构造输入
messages = [
    {"role": "user", "content": "你好，请介绍一下你自己。"}
]
input_text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)

# 生成回答
outputs = model.generate(**inputs, max_new_tokens=512)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

Qwen 大模型基于 QLoRA 的微调实战指南

简介

训练环境配置

配置文件详解

数据准备

开始训练

推理与测试

常见问题与优化

1. 显存溢出 (OOM)

2. Loss 不下降

3. 模型效果不佳

4. 推理速度慢

更多推荐文章

相关免费在线工具

Qwen 大模型基于 QLoRA 的微调实战指南

简介

训练环境配置

配置文件详解

数据准备

开始训练

推理与测试

常见问题与优化

1. 显存溢出 (OOM)

2. Loss 不下降

3. 模型效果不佳

4. 推理速度慢

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具