LlamaFactory 大模型微调全流程解析 | 极客日志

PythonAI算法

LlamaFactory 大模型微调全流程解析

LlamaFactory 提供了高效的大语言模型微调方案，支持多种训练阶段与微调方法。涵盖数据配置、模型训练、评估、推理及导出全流程，重点讲解 Alpaca 与 ShareGPT 格式处理、LoRA 微调实战及 WebUI 操作细节，帮助开发者快速上手大模型定制。

邪神洛基发布于 2026/4/8更新于 2026/7/622 浏览

LlamaFactory 大模型微调全流程解析

整体概述

LlamaFactory 是一个简单易用且高效的大型语言模型训练与微调平台。通过它，我们可以在无需编写复杂代码的前提下，在本地完成上百种预训练模型的微调工作。

数据处理

LlamaFactory 训练所需的数据集中存放在项目根目录下的 data 文件夹中。该目录主要包含用于定义和管理数据集配置信息的 dataset_info.json 文件，以及其他各种格式的训练数据文件。

dataset_info.json 配置

dataset_info.json 是核心配置文件，用于定义数据集的名称、路径、格式、列名绑定等元数据。它支持本地数据集（如自定义文件或 Demo 样例）和在线数据集（如 Hugging Face 或 ModelScope 提供的仓库）。

配置模板如下：

"数据集名称": {
  "hf_hub_url": "Hugging Face 的数据集仓库地址",
  "ms_hub_url": "ModelScope 的数据集仓库地址",
  "script_url": "包含数据加载脚本的本地文件夹名称",
  "file_name": "该目录下数据集文件夹或文件的名称",
  "formatting": "数据集格式（可选，默认：alpaca）",
  "ranking": "是否为偏好数据集（可选，默认：False）",
  "subset": "数据集子集的名称",
  "split": "所使用的数据集切分（可选，默认：train）",
  "folder": "Hugging Face 仓库的文件夹名称",
  "num_samples"

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

[
  {
    "instruction": "请对以下文本进行中文拼写、语法纠错，仅输出纠错后的文本。",
    "input": "都分患者不清楚白天和黑夜。",
    "output": "部分患者不清楚白天和黑夜。"
  }
]

[ {"text": "document"} ]

[
  {
    "instruction": "人类指令",
    "input": "人类输入",
    "chosen": "优质回答",
    "rejected": "劣质回答"
  }
]

{
  "conversations": [
    {"from": "human", "value": "人类指令"},
    {"from": "gpt", "value": "模型回答"}
  ],
  "system": "系统提示词"
}

modelscope download --model 'Qwen/Qwen2.5-3B-Instruct' --local_dir '/mnt/workspace/ms_cache/'

LlamaFactory 大模型微调全流程解析

LlamaFactory 大模型微调全流程解析

整体概述

数据处理

dataset_info.json 配置

更多推荐文章

相关免费在线工具

数据集格式

Alpaca 格式

ShareGPT 格式

模型训练

训练阶段

微调方法

实战示例

模型评估与推理

模型评估

模型推理

模型导出

更多推荐文章

相关免费在线工具

LlamaFactory 大模型微调全流程解析

LlamaFactory 大模型微调全流程解析

整体概述

数据处理

dataset_info.json 配置

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

数据集格式

Alpaca 格式

ShareGPT 格式

模型训练

训练阶段

微调方法

实战示例

模型评估与推理

模型评估

模型推理

模型导出

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具