基于 Qwen2.5 与 LLaMA-Factory 的 LoRA 微调实战 | 极客日志

PythonAI算法

基于 Qwen2.5 与 LLaMA-Factory 的 LoRA 微调实战

介绍在 Windows 环境下利用 LLaMA-Factory 框架对 Qwen2.5-1.5B 模型进行 LoRA 微调。内容包括数据集准备与人设注入、基座模型下载、工具安装配置、训练参数设置、模型验证及通过 Ollama 本地部署。旨在帮助开发者在消费级显卡上完成专属大模型的构建与落地。

嘘发布于 2026/4/6更新于 2026/7/549 浏览

基于 Qwen2.5 与 LLaMA-Factory 的 LoRA 微调实战

⚠️ 实验环境警告 本教程涉及 PyTorch、ModelScope 及 LLaMA-Factory 等多个深度学习框架，依赖关系较为复杂。为了避免污染您的系统 Python 环境或引发版本冲突，强烈建议在 Anaconda / Miniconda 虚拟环境中进行本实验。说明：本文档默认读者已具备基础的 Python 开发环境配置能力。关于 Anaconda 的安装、CUDA 驱动的更新及系统环境变量的配置，不在本文讨论范围内，请自行查阅相关基础教程。

1. 准备数据集 (Data Preparation)

微调的第一步是获取原始指令数据。本项目通过两种方式获取数据，并利用 Python 脚本进行人设注入（Identity Injection），将通用数据转化为专属训练语料。

1.1 下载原始数据集（两种方式）

方式 A：手动下载 (Manual Download)

访问 ModelScope 数据集页面搜索 alpaca_zh。
在文件列表中找到 alpaca_zh.json，手动点击下载按钮。
将下载的文件保存至项目目录下。

方式 B：自动化下载（推荐）

使用 modelscope 库自动获取数据集，适合自动化工作流：

def download_dataset():
    # 获取当前工作目录
    current_dir = os.getcwd()
    # 建议下载到一个专门的子目录中，例如 'dataset'
    target_dir = os.path.join(current_dir, 'yuki_identity_sft')
    if not os.path.exists(target_dir):
        os.makedirs(target_dir)
    print(f"正在下载数据集到：{target_dir}")
    # 使用 subprocess 调用 modelscope 命令，并指定 --local_dir 为目标子目录
    result = subprocess.run(['modelscope', 'download', '--dataset', 'DanKe123abc/yuki_identity_sft', '--local_dir', target_dir], capture_output=True, text=True)

1.2 预处理与人物替换 (Preprocessing & Identity Swap)

下载完成后，必须运行预处理脚本。该脚本会遍历所有对话条目，将原有的助手名称及开发商替换为自定义名称。

核心预处理脚本 (preprocess.py):

def finalize_elaine_dataset():
    
    old_jsonl = os.path.join(target_dir, )
    new_jsonl = os.path.join(target_dir, )
    info_file = os.path.join(target_dir, )
    
    
     os.path.exists(old_jsonl):
        ()
         (old_jsonl, , encoding=)  f_in, \
             (new_jsonl, , encoding=)  f_out:
             line  f_in:
                
                updated_line = line.replace(old_name.capitalize(), new_name.capitalize())
                updated_line = updated_line.replace(old_name.lower(), new_name.lower())
                f_out.write(updated_line)
        os.remove(old_jsonl) 
        ()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

{"default":{"features":{"conversations":{"_type":"Value"}},"splits":{"train":{"name":"train","dataset_name":"elaine_identity_sft"}}}}

pip install modelscope

def download_qwen_model():
    model_id = 'qwen/Qwen2.5-1.5B-Instruct' # 指定下载到的本地目录
    local_dir = './models/Qwen2.5-1.5B-Instruct'
    if not os.path.exists(local_dir):
        os.makedirs(local_dir)
    print(f"正在开始下载模型 {model_id} 到 {local_dir}...")
    # 执行下载
    model_dir = snapshot_download(model_id, cache_dir=local_dir)
    print(f"\n模型下载成功！")
    print(f"模型存储路径：{os.path.abspath(model_dir)}")

cd D:\Code\LoRA
git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

# 安装基础包及常用库（metrics 计算、bitsandbytes 量化、qwen 模型支持）
pip install -e .[metrics,bitsandbytes,qwen]
# 针对 Windows 环境，通常还需要额外安装以下库以确保加速正常
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

llamafactory-cli version

{"elaine_identity":{"file_name":"D:/Code/LoRA/yuki_identity_sft/elaine_identity_sft.jsonl","formatting":"sharegpt","columns":{"messages":"conversations"},"tags":{"role_tag":"role","content_tag":"content","user_tag":"user","assistant_tag":"assistant"}},"...":"（原有其他数据集配置）"}

### 模型路径 (已修正为深层路径)
model_name_or_path: D:/Code/LoRA/models/Qwen2.5-1.5B-Instruct/qwen/Qwen2___5-1___5B-Instruct
### 训练阶段
stage: sft
do_train: true
finetuning_type: lora
lora_target: all
### 数据集配置
dataset: elaine_identity
template: qwen
cutoff_len: 1024
max_samples: 1000
overwrite_cache: true
### 输出路径
output_dir: saves/elaine_lora_sft
logging_steps: 5
save_steps: 100
plot_loss: true
overwrite_output_dir: true
### 8G 显存专用参数
per_device_train_batch_size: 1
gradient_accumulation_steps: 8
learning_rate: 1.0e-4
num_train_epochs: 10.0
fp16: true
quantization_bit: 4
upcast_layernorm: true
# 建议添加：提高量化精度并防止溢出

# 设置环境变量防止 OpenMP 冲突报错
$env:KMP_DUPLICATE_LIB_OK="TRUE"
# 启动微调
llamafactory-cli train elaine_lora.yaml

def start_chat():
    args = {
        "model_name_or_path": r"D:/Code/LoRA/models/Qwen2.5-1.5B-Instruct/qwen/Qwen2___5-1___5B-Instruct",
        "adapter_name_or_path": r"D:/Code/LoRA/LLaMA-Factory/saves/elaine_lora_sft",
        "template": "qwen",
        "finetuning_type": "lora",
        "quantization_bit": 4,
    }
    chat_model = ChatModel(args)
    print("\n--- 助手已上线 (输入 'quit' 退出) ---")

llamafactory-cli export \
  --model_name_or_path D:/Code/LoRA/models/Qwen2.5-1.5B-Instruct/qwen/Qwen2___5-1___5B-Instruct \
  --adapter_name_or_path D:/Code/LoRA/LLaMA-Factory/saves/elaine_lora_sft \
  --template qwen \
  --finetuning_type lora \
  --export_dir D:/Code/LoRA/models/Elaine_Final_Model \
  --export_size 2 \
  --export_device cpu \
  --export_legacy_format false

cd D:/Code/LoRA/models/Elaine_Final_Model

ollama create Assistant -f Modelfile

ollama run Assistant

基于 Qwen2.5 与 LLaMA-Factory 的 LoRA 微调实战

基于 Qwen2.5 与 LLaMA-Factory 的 LoRA 微调实战

1. 准备数据集 (Data Preparation)

1.1 下载原始数据集（两种方式）

方式 A：手动下载 (Manual Download)

方式 B：自动化下载（推荐）

1.2 预处理与人物替换 (Preprocessing & Identity Swap)

更多推荐文章

相关免费在线工具

1.3 数据集注册 (Registration)

2. 下载基座模型 (Base Model Download)

方式 A：代码自动下载（推荐方式）

方式 B：手动下载（备选方式）

3. 下载工具 LLaMA-Factory (Tools Setup)

3.1 工具简介

3.2 下载与安装步骤

步骤 1：克隆源代码

步骤 2：安装核心依赖

步骤 3：验证安装

4. 修改配置文件 (Configuration)

4.1 添加数据集定义文件 (Add Dataset Info)

4.2 修改训练参数配置文件 (Modify Training Config)

4.3 关键点解释

5. 开始微调训练 (Start Training)

5.1 执行训练命令

5.2 训练过程关键指标

5.3 产出物检查

5.4 验证与对话测试 (Validation)

方式 A：官方 WebUI 验证（标准路径）

方式 B：Python 脚本流式调用（稳定路径 / 本项目采用）

验证标准 (Checklist)

6. 打包与 Ollama 部署测试 (Export & Deployment)

6.1 模型权重合并 (Export & Merge)

6.2 注册至 Ollama

6.3 最终成果验证

更多推荐文章

相关免费在线工具

基于 Qwen2.5 与 LLaMA-Factory 的 LoRA 微调实战

基于 Qwen2.5 与 LLaMA-Factory 的 LoRA 微调实战

1. 准备数据集 (Data Preparation)

1.1 下载原始数据集（两种方式）

方式 A：手动下载 (Manual Download)

方式 B：自动化下载（推荐）

1.2 预处理与人物替换 (Preprocessing & Identity Swap)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.3 数据集注册 (Registration)

2. 下载基座模型 (Base Model Download)

方式 A：代码自动下载（推荐方式）

方式 B：手动下载（备选方式）

3. 下载工具 LLaMA-Factory (Tools Setup)

3.1 工具简介

3.2 下载与安装步骤

步骤 1：克隆源代码

步骤 2：安装核心依赖

步骤 3：验证安装

4. 修改配置文件 (Configuration)

4.1 添加数据集定义文件 (Add Dataset Info)

4.2 修改训练参数配置文件 (Modify Training Config)

4.3 关键点解释

5. 开始微调训练 (Start Training)

5.1 执行训练命令

5.2 训练过程关键指标

5.3 产出物检查

5.4 验证与对话测试 (Validation)

方式 A：官方 WebUI 验证（标准路径）

方式 B：Python 脚本流式调用（稳定路径 / 本项目采用）

验证标准 (Checklist)

6. 打包与 Ollama 部署测试 (Export & Deployment)

6.1 模型权重合并 (Export & Merge)

6.2 注册至 Ollama

6.3 最终成果验证

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具