LLaMA-Factory 简介
LLaMA-Factory 是一个开源且高效的工具库,旨在简化和加速基于 LLaMA(Large Language Model Meta AI)架构的大语言模型的训练、微调和部署过程。它针对大语言模型的多样化需求提供了全面的解决方案,支持模型预训练、指令微调(SFT)、偏好对齐(DPO/RLHF)、评估和部署等全流程操作。
该工具库以其低资源消耗、高灵活性和易用性著称,支持多种主流大模型架构(如 LLaMA, Qwen, ChatGLM, Baichuan 等),并集成了 WebUI 和命令行界面,适合从初学者到高级研究人员使用。
1. 主要功能
1.1 模型预训练
- 模型初始化:支持加载预训练权重并继续预训练,适用于构建特定领域的基座模型。
- 训练脚本:内置大规模数据训练的优化脚本,支持分布式训练。
- 数据准备:提供高效的数据处理工具,支持自定义数据集格式转换。
1.2 微调
- 指令微调(SFT):支持全量微调、LoRA、QLoRA 等多种微调策略,适应不同显存环境。
- 超参数优化:集成学习率调度器、梯度累积等功能,便于调整训练超参数以获得最佳性能。
- 定制数据支持:允许使用 JSON、JSONL、CSV 等多种格式的自定义数据集进行微调。
1.3 评估
- 性能评估:提供自动化评估工具,支持计算困惑度(Perplexity)、准确率、召回率和 F1 分数等指标。
- 测试集支持:支持使用标准基准测试集(如 C-Eval, CMMLU)和自定义测试集进行模型评估。
1.4 部署
- 部署工具:提供将训练好的模型部署到生产环境的工具和脚本,支持多卡推理。
- API 支持:支持创建 RESTful API 以便于与其他应用集成,兼容 FastAPI 和 vLLM。
- 优化:包含模型量化(INT8/INT4)和压缩工具,以提高推理效率和降低显存占用。
2. 安装和环境配置
2.1 环境要求
- Python 3.8+
- PyTorch 2.0+ (建议配合 CUDA 11.8 或更高版本)
- Transformers, Datasets, Accelerate 等依赖库
2.2 安装方式
使用 pip 安装:
pip install llamafactory
从 GitHub 源码安装(推荐开发版):
git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch]"
2.3 配置文件说明
安装后,需要配置参数文件以适应训练或部署环境。核心配置文件通常包括:
- 数据路径:指定训练数据和验证数据的位置。
- 模型参数:设置模型名称、层数、隐藏单元维度等。
- 超参数:配置学习率、批次大小(batch size)、梯度累积步数、训练轮数(epochs)等。
- 微调策略:选择 Full Fine-tuning、LoRA 或 P-Tuning 等方法。


