从数据集构建到 LoRA 微调：使用 LlamaFactory 实现高效文本分类 | 极客日志

PythonAI算法

从数据集构建到 LoRA 微调：使用 LlamaFactory 实现高效文本分类

综述由AI生成使用 LLaMA-Factory 框架基于 Qwen2.5-7B-Instruct 模型进行 LoRA 微调以实现文本分类的完整流程。内容包括按 Alpaca 格式构建数据集、配置 YAML 训练参数、执行命令行训练、加载 LoRA 权重进行推理以及使用 Python 脚本评估模型效果。文章详细解析了关键参数含义、提供了评估代码示例，并给出了显存优化、防过拟合及推理加速等实用建议，帮助开发者高效完成垂直领域模型训练。

松间照月发布于 2025/2/7更新于 2026/6/327 浏览

从数据集构建到 LoRA 微调：使用 LlamaFactory 实现高效文本分类

背景介绍

本文详细介绍如何使用 LLaMA-Factory 框架利用开源大语言模型完成文本分类任务。以 LoRA 微调 qwen/Qwen2.5-7B-Instruct 为例，展示从数据准备、配置训练到推理评估的完整流程。

文本分类数据集构建

为了适配 LLaMA-Factory 的训练格式，我们需要按照 Alpaca 样式构建数据集。将自定义数据集添加到 LLaMA-Factory/data/dataset_info.json 文件中，以便后续直接根据自定义数据集名称加载数据。

数据集示例结构如下：

[
  {
    "instruction": "请将以下文本分类到一个最符合的类别中。以下是类别及其定义：",
    "input": "改革创新发展、行政区划调整、行政管理体制等方面的内容，涉及到体制机制的改革与完善，旨在推动高质量发展和提升生活品质。",
    "output": "reason: 该文本主要讨论的是 xxx。因此，该文本最符合'社会管理'这一类别。\n\nlabel: 社会管理"
  }
]

在构建数据集时，建议明确定义每个类别的含义，并在 instruction 中提供清晰的指令。输入部分（input）包含待分类的原始文本，输出部分（output）则包含模型的推理理由（reason）和最终标签（label）。这种结构化输出有助于后续自动化评估。

LoRA 微调配置

LLaMA-Factory 支持网页端训练，但生产环境通常推荐使用命令行进行更灵活的控制。我们将训练参数存储在 YAML 配置文件中，例如 qwen_train_cls.yaml。

配置文件详解：

### model
model_name_or_path: qwen/Qwen2.5-7B-Instruct

### method
stage: sft
finetuning_type: lora
lora_target: all

### dataset
dataset_dir: LLaMA-Factory/data/
dataset: 数据集名
template: qwen
cutoff_len:

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

nohup llamafactory-cli train qwen_train_cls.yaml > qwen_train_cls.log 2>&1 &

llamafactory-cli chat \
  --model_name_or_path qwen/Qwen2.5-7B-Instruct \
  --adapter_name output/qwen2.5-7B/cls_epoch2 \
  --template qwen \
  --infer_backend vllm

import os
import re
import json
from sklearn.metrics import classification_report, confusion_matrix

# 文本类别列表
CLASS_NAME = [
    "产业相关",
    "法律法规与行政事务",
    "其他",
    # ... 补充完整所有类别
]

def load_jsonl(file_path):
    """加载 JSONL 文件"""
    data = []
    try:
        with open(file_path, "r", encoding="utf-8") as file:
            for line in file:
                tmp = json.loads(line)
                data.append(tmp)
    except FileNotFoundError as e:
        print(f"文件未找到：{file_path}")
        raise e
    return data

def parser_label(text: str):
    """从模型输出中提取 label"""
    pattern = r"label[:：\s\.\d\*]*([^\s^\*]+)"
    matches = re.findall(pattern, text, re.DOTALL)
    if len(matches) == 1:
        return matches[0]
    return None

def trans2num(item):
    """将类别名称转换为索引"""
    predict = parser_label(item["predict"])
    label = parser_label(item["label"])

    predict_idx = -1
    label_idx = -1
    for idx, cls_name in enumerate(CLASS_NAME):
        if predict == cls_name:
            predict_idx = idx
        if label == cls_name:
            label_idx = idx

    return predict_idx, label_idx

def cls_eval(input_file):
    """执行评估"""
    data = load_jsonl(file_path=input_file)
    predicts = []
    labels = []

    for item in data:
        predict, label = trans2num(item)
        if label == -1:
            continue
        predicts.append(predict)
        labels.append(label)

    report = classification_report(predicts, labels, output_dict=False)
    print(report)
    return report

if __name__ == "__main__":
    cls_eval("xxx/generated_predictions.jsonl")

从数据集构建到 LoRA 微调：使用 LlamaFactory 实现高效文本分类

从数据集构建到 LoRA 微调：使用 LlamaFactory 实现高效文本分类

背景介绍

文本分类数据集构建

LoRA 微调配置

更多推荐文章

相关免费在线工具

启动模型训练

模型部署与推理

文本分类评估代码

常见问题与优化建议

更多推荐文章

相关免费在线工具

从数据集构建到 LoRA 微调：使用 LlamaFactory 实现高效文本分类

从数据集构建到 LoRA 微调：使用 LlamaFactory 实现高效文本分类

背景介绍

文本分类数据集构建

LoRA 微调配置

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

启动模型训练

模型部署与推理

文本分类评估代码

常见问题与优化建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具