LLaMA-Factory 简介
LLaMA-Factory 是一个整合了主流高效训练微调技术的开源框架,支持多种大模型架构。它提供了丰富的功能,包括全参数微调、LoRA、QLoRA 等,适配性好且易于上手。
环境安装
基础环境配置
推荐使用 Conda 管理 Python 环境,创建虚拟环境并激活:
conda create -n llamafactory python=3.8.0
conda activate llamafactory
克隆项目代码并进入目录:
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
安装依赖包(包含 PyTorch 和指标库):
pip install -e ".[torch,metrics]"
Windows 特殊配置
如果在 Windows 环境下开启量化 LoRA(QLoRA),需要安装预编译的 bitsandbytes 库,支持 CUDA 11.1 - 12.2。请根据实际 CUDA 版本选择合适的 wheel 文件进行安装。
若需使用 FlashAttention-2,同样需要安装预编译的 flash-attn 库,支持 CUDA 12.1 - 12.2。
数据准备
LLaMA-Factory 的数据集通常放置在 /data 路径下。标准的数据格式为 JSONL 或 JSON 数组,每条记录包含指令、输入和输出字段。
示例数据结构如下:
[
{
"instruction": "你好",
"input": "",
"output": "你好!有什么可以帮你的吗?"
},
{
"instruction": "解释一下什么是人工智能",
"input": "",
"output": "人工智能是计算机科学的一个分支..."
}
]


