LlamaFactory 大模型微调实战指南 | 极客日志

PythonAI算法

LlamaFactory 大模型微调实战指南

综述由AI生成LlamaFactory 提供了一套完整的本地大模型微调方案，涵盖数据配置、训练策略、评估及导出全流程。支持 Alpaca 与 ShareGPT 格式，兼容全参数、LoRA 等多种微调方式，可快速实现 Qwen 等开源模型的指令微调与偏好对齐，降低部署门槛。

月亮邮递员发布于 2026/4/12更新于 2026/6/1219 浏览

LlamaFactory 大模型微调实战指南

概述

LlamaFactory 是一个简单易用且高效的大型语言模型训练与微调平台。通过它，我们可以在无需编写复杂代码的前提下，在本地完成上百种预训练模型的微调工作。

数据处理

LlamaFactory 训练所需的数据集中存放在项目根目录下的 data 文件夹中。这里主要包含用于定义和管理数据集配置信息的 dataset_info.json 文件，以及实际的各种格式训练数据文件。

dataset_info.json 配置

这个 JSON 文件是核心配置项，定义了数据集的名称、路径、格式、样本数量及列名绑定等元数据。它支持本地数据集（如自定义文件或 Demo）和在线数据集（如 Hugging Face、ModelScope）。

配置模板结构如下：

"数据集名称": {
  "hf_hub_url": "Hugging Face 仓库地址",
  "ms_hub_url": "ModelScope 仓库地址",
  "script_url": "数据加载脚本文件夹",
  "file_name": "数据集文件名",
  "formatting": "alpaca", 
  "ranking": false,
  "subset": "子集名称",
  "split": "train",
  "columns": {
    "prompt": "instruction",

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

[
  {
    "instruction": "请对以下文本进行中文拼写纠错。",
    "input": "都分患者不清楚白天和黑夜。",
    "output": "部分患者不清楚白天和黑夜。"
  }
]

"dataset_name": {
  "file_name": "data.json",
  "columns": {
    "prompt": "instruction",
    "query": "input",
    "response": "output"
  }
}

"dataset_name": {
  "file_name": "data.json",
  "columns": { "prompt": "text" }
}

"dataset_name": {
  "file_name": "data.json",
  "ranking": true,
  "columns": {
    "prompt": "instruction",
    "query": "input",
    "chosen": "chosen",
    "rejected": "rejected"
  }
}

{
  "conversations": [
    { "from": "human", "value": "你好" },
    { "from": "gpt", "value": "你好！有什么可以帮您？" }
  ]
}

modelscope download --model 'Qwen/Qwen2.5-3B-Instruct' --local_dir '/mnt/workspace/ms_cache/'

LlamaFactory 大模型微调实战指南

LlamaFactory 大模型微调实战指南

概述

数据处理

dataset_info.json 配置

更多推荐文章

相关免费在线工具

数据集格式详解

Alpaca 格式

ShareGPT 格式

模型训练

训练阶段

微调方法

实战示例

模型评估

模型推理

模型导出

更多推荐文章

相关免费在线工具

LlamaFactory 大模型微调实战指南

LlamaFactory 大模型微调实战指南

概述

数据处理

dataset_info.json 配置

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

数据集格式详解

Alpaca 格式

ShareGPT 格式

模型训练

训练阶段

微调方法

实战示例

模型评估

模型推理

模型导出

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具