Qwen2.5 PyTorch 模型微调入门实战

Qwen2.5 PyTorch 模型微调入门实战 | 极客日志

# 下载并安装 CANN Toolkit
wget https://ascend-repo.obs.cn-east-2.myhuaweicloud.com/Milan-ASL/Milan-ASL%20V100R001C17SPC701/Ascend-cann-toolkit_8.0.RC1.alpha001_linux-$(uname -i).run
bash Ascend-cann-toolkit_8.0.RC1.alpha001_linux-$(uname -i).run --install

# 下载并安装 CANN Kernels (针对 910b 芯片)
wget https://ascend-repo.obs.cn-east-2.myhuaweicloud.com/Milan-ASL/Milan-ASL%20V100R001C17SPC701/Ascend-cann-kernels-910b_8.0.RC1.alpha001_linux.run
bash Ascend-cann-kernels-910b_8.0.RC1.alpha001_linux.run --install

# 设置环境变量
source /usr/local/Ascend/ascend-toolkit/set_env.sh

# 安装 openMind Hub Client
pip install openmind_hub

# 安装 openMind Library (包含 PyTorch 框架及其依赖)
pip install openmind[pt]

# 安装 LLaMA-Factory 用于微调
git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch-npu,metrics]"

git lfs install
git clone https://modelers.cn/AI-Research/Qwen2.5-7B-Instruct.git

import argparse
from openmind import AutoModelForCausalLM, AutoTokenizer
from openmind_hub import snapshot_download

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "--model_name_or_path",
        type=str,
        help="Path to model",
        default=None,
    )
    args = parser.parse_args()
    return args

def main():
    args = parse_args()
    if args.model_name_or_path:
        model_path = args.model_name_or_path
    else:
        # 自动下载模型权重
        model_path = snapshot_download("AI-Research/Qwen2.5-7B-Instruct", revision="main", resume_download=True,
                                    ignore_patterns=[" .h5", " .ot", "*.mspack"])

    model = AutoModelForCausalLM.from_pretrained(
        model_path,
        torch_dtype="auto",
        device_map="auto"
    )
    tokenizer = AutoTokenizer.from_pretrained(model_path)

    prompt = '你是谁'
    messages = [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": prompt}
    ]
    text = tokenizer.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )
    model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

    generated_ids = model.generate(
        **model_inputs,
        max_new_tokens=512
    )
    generated_ids = [
        output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]

    response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
    print(response)

if __name__ == "__main__":
    main()

python inference_qwen2.5_7b_chat.py

model_name_or_path: xxx # 填写本地加载的 Qwen2.5-7B-Instruct 权重路径
template: qwen

llamafactory-cli chat examples/inference/qwen2.5_7b_chat.yaml

### model
model_name_or_path: xxx/xxx  # 预训练模型本地路径

### method
stage: sft                 # 监督微调阶段
do_train: true             # 开启训练
finetuning_type: lora      # 使用 LoRA 高效微调
lora_target: all           # 对所有线性层应用 LoRA

### dataset
dataset: identity          # 数据集名称
template: qwen             # 模板类型
cutoff_len: 1024           # 最大截断长度
max_samples: 1000          # 样本数量限制
overwrite_cache: true      # 覆盖缓存
preprocessing_num_workers: 16 # 预处理进程数

### output
output_dir: ./saves/qwen2.5_7b/lora/sft
logging_steps: 10
save_steps: 500
plot_loss: true            # 绘制 Loss 曲线
overwrite_output_dir: true

### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 8   # 梯度累积，等效 batch_size 为 8
learning_rate: 1.0e-4
num_train_epochs: 10.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
bf16: true                     # 使用 bf16 混合精度加速
ddp_timeout: 180000000

### eval
val_size: 0.1
per_device_eval_batch_size: 1
eval_strategy: steps
eval_steps: 500

llamafactory-cli train examples/train_lora/qwen2.5_7b_lora_sft.yaml

model_name_or_path: xxx # 基础模型路径
adapter_name_or_path: ./saves/qwen2.5_7b/lora/sft # 微调后的 LoRA 权重路径
template: qwen

llamafactory-cli chat examples/inference/qwen2.5_7b_chat.yaml

Qwen2.5 PyTorch 模型微调入门实战

Qwen2.5 PyTorch 模型微调入门实战

1 引言

2 环境准备

2.1 安装 Ascend CANN Toolkit 和 Kernels

2.2 安装 openMind Library 及依赖

3 模型下载

4 模型推理

4.1 使用 openMind Library 推理

4.2 使用 LLaMA-Factory 交互

5 模型微调

5.1 数据集准备

5.2 微调配置详解

5.3 微调可视化

5.4 微调后推理

5.4.1 加载适配器

5.4.2 执行推理

6 常见问题与优化建议

6.1 显存溢出处理

6.2 训练速度优化

6.3 评估指标

7 结语

更多推荐文章

相关免费在线工具

Qwen2.5 PyTorch 模型微调入门实战

Qwen2.5 PyTorch 模型微调入门实战

1 引言

2 环境准备

2.1 安装 Ascend CANN Toolkit 和 Kernels

2.2 安装 openMind Library 及依赖

3 模型下载

4 模型推理

4.1 使用 openMind Library 推理

4.2 使用 LLaMA-Factory 交互

5 模型微调

5.1 数据集准备

5.2 微调配置详解

5.3 微调可视化

5.4 微调后推理

5.4.1 加载适配器

5.4.2 执行推理

6 常见问题与优化建议

6.1 显存溢出处理

6.2 训练速度优化

6.3 评估指标

7 结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具