LlamaFactory 大模型微调实战指南
概述
LlamaFactory 是一个简单易用且高效的大型语言模型训练与微调平台。通过它,我们可以在无需编写复杂代码的前提下,在本地完成上百种预训练模型的微调工作。
数据处理
LlamaFactory 训练所需的数据集中存放在项目根目录下的 data 文件夹中。这里主要包含用于定义和管理数据集配置信息的 dataset_info.json 文件,以及实际的各种格式训练数据文件。
dataset_info.json 配置
这个 JSON 文件是核心配置项,定义了数据集的名称、路径、格式、样本数量及列名绑定等元数据。它支持本地数据集(如自定义文件或 Demo)和在线数据集(如 Hugging Face、ModelScope)。
配置模板结构如下:
"数据集名称": {
"hf_hub_url": "Hugging Face 仓库地址",
"ms_hub_url": "ModelScope 仓库地址",
"script_url": "数据加载脚本文件夹",
"file_name": "数据集文件名",
"formatting": "alpaca",
"ranking": false,
"subset": "子集名称",
"split": "train",
"columns": {
"prompt": "instruction",

