LLaMA-Factory 大模型微调实战指南

LLaMA-Factory 是一个简单易用且高效的大型语言模型训练与微调平台。通过它，你可以在无需编写复杂代码的前提下，在本地完成上百种预训练模型的微调。框架支持多种模型架构、丰富的训练算法以及灵活的精度控制。

一、核心特性

模型种类：支持 LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等主流模型。
训练算法：涵盖（增量）预训练、指令监督微调、奖励模型训练、PPO、DPO、KTO、ORPO 等。
运算精度：支持 16 比特全参数微调、冻结微调、LoRA 微调，以及基于 AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ 的 2~8 比特 QLoRA 微调。
优化算法：集成 GaLore、BAdam、DoRA、LongLoRA、LoRA+、LoftQ 和 PiSSA 等前沿技术。
加速算子：内置 FlashAttention-2 和 Unsloth 支持。
推理引擎：兼容 Transformers 和 vLLM。
实验监控：支持 LlamaBoard、TensorBoard、Wandb、MLflow、SwanLab 等。

二、安装部署

1. CUDA 环境准备

CUDA 是 NVIDIA 提供的并行计算平台和编程模型。首先确认你的 GPU 是否支持 CUDA，并检查当前 Linux 版本兼容性。

在命令行中输入以下命令查看系统信息：

uname -m && cat /etc/*release

确保输出中包含 x86_64 及对应的 Ubuntu 版本（如 22.04）。接着检查编译器版本：

gcc --version

建议下载 CUDA 12.2 或更高版本。如果之前安装过旧版本（如 12.1），需先卸载。可以使用官方卸载脚本，或者直接删除相关目录并清理包管理器缓存：

sudo rm -r /usr/local/cuda-12.1/
sudo apt clean && sudo apt autoclean

然后运行安装程序，注意在安装过程中取消勾选驱动安装选项，以免版本冲突。安装完成后，输入 nvcc -V 验证版本号。

2. LLaMA-Factory 安装

基础环境推荐配置为：Ubuntu 22.04 + CUDA 12.4 + Python 3.11 + PyTorch 2.x。

创建 Conda 环境并安装核心依赖：

conda create -n llama_factory python=3.10 -y
conda activate llama_factory
conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia
pip install torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

克隆项目并安装依赖：

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

LLaMA-Factory 大模型微调实战指南

LLaMA-Factory 大模型微调实战指南

一、核心特性

二、安装部署

1. CUDA 环境准备

2. LLaMA-Factory 安装

更多推荐文章

相关免费在线工具

3. 模型下载

4. Windows 特殊配置

三、数据微调

1. 指令监督微调数据集

2. 预训练与偏好数据集

3. 多模态数据集

四、WebUI 操作

五、SFT 训练

六、LoRA 合并与量化

1. 模型合并

2. 模型量化

七、推理

1. 配置示例

2. 批量推理与 API

八、评估

1. 通用能力评估

2. NLG 评估

3. 常用评估参数

更多推荐文章

相关免费在线工具

LLaMA-Factory 大模型微调实战指南

LLaMA-Factory 大模型微调实战指南

一、核心特性

二、安装部署

1. CUDA 环境准备

2. LLaMA-Factory 安装

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 模型下载

4. Windows 特殊配置

三、数据微调

1. 指令监督微调数据集

2. 预训练与偏好数据集

3. 多模态数据集

四、WebUI 操作

五、SFT 训练

六、LoRA 合并与量化

1. 模型合并

2. 模型量化

七、推理

1. 配置示例

2. 批量推理与 API

八、评估

1. 通用能力评估

2. NLG 评估

3. 常用评估参数

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具