LLaMA-Factory 大语言模型微调框架详解与使用指南 | 极客日志

PythonAI算法

LLaMA-Factory 大语言模型微调框架详解与使用指南

综述由AI生成LLaMA-Factory 是一款专为大型语言模型微调设计的低代码开源框架。它支持高效低成本地微调上百个模型，提供友好的 Web 界面，用户无需编写代码即可定制和微调。集成了 LoRA、GaLore、DoRA 等多种微调方法和优化技术，支持多模态指令监督微调、奖励模型训练等。具备实时监控评估功能，集成 TensorBoard 等工具，并提供基于 vLLM 的极速推理 API。安装过程简便，通过 conda 创建环境、克隆代码库并安装依赖即可启动服务，适合快速上手大模型应用开发。支持通过 YAML 配置文件灵活定义训练任务，涵盖多种模型架构与精度选项。

时间旅人发布于 2025/2/6更新于 2026/6/219 浏览

LLaMA-Factory：大语言模型微调框架

LLaMA-Factory 简介图

一、功能特点

LLaMA-Factory 是一个低代码大模型训练框架，专为大型语言模型（LLMs）的微调而设计。其主要功能特点包括：

高效且低成本：能够高效且低成本地支持对 100 多个模型进行微调，简化了模型微调的过程。
易于访问和使用：提供了友好的用户界面，用户无需编写代码即可轻松定制和微调 LLMs。
丰富的数据集选项：支持多个数据集选项，用户可以选择自带的数据集或自己生成数据集进行微调。
多样化的算法支持：集成了业界最广泛使用的微调方法和优化技术，如 LoRA、GaLore、DoRA 等。
实时监控和评估：支持集成 TensorBoard、WandB 和 MLflow 等监控工具，便于实时监控训练过程和评估模型性能。
极速推理：提供了基于 vLLM 的 OpenAI 风格 API、浏览器界面和命令行接口，实现快速推理。

二、安装

LLaMA-Factory 的安装相对简单，以下是一般的安装步骤（以 conda 环境为例）：

创建 Python 环境

使用 conda 创建一个新的 Python 环境，并安装必要的依赖库，如 PyTorch 等。

conda create -n llm python=3.10
conda activate llm

克隆 LLaMA-Factory 项目

通过 Git 克隆 LLaMA-Factory 的源代码到本地。

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

安装依赖

进入项目目录，安装必要的 Python 依赖库。

pip install -e ".[torch,metrics]"

启动服务

在项目目录中运行 python src/train_web.py 启动服务，然后在浏览器中访问相应的端口（默认可能是 7860）以访问训练界面。

Web UI 界面截图

三、支持的算法

LLaMA-Factory 支持多种先进的微调算法和模型，包括但不限于：

多种模型：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。
集成方法：（增量）预训练、（多模态）指令监督微调、奖励模型训练、PPO 训练、DPO 训练、KTO 训练、ORPO 训练等等。
多种精度：16 比特全参数微调、冻结微调、LoRA 微调和基于 AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ 的 2/3/4/5/6/8 比特 QLoRA 微调。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

eval_strategy: steps
per_device_train_batch_size: 4
gradient_accumulation_steps: 4
learning_rate: 1.0e-4
lr_scheduler_type: cosine
max_seq_length: 1024
output_dir: ./outputs/yuan2_lora
overwrite_output_dir: true
seed: 42
total_batch_size: 16
train_on_inputs: false
use_lora: true

LLaMA-Factory 大语言模型微调框架详解与使用指南

LLaMA-Factory：大语言模型微调框架

一、功能特点

二、安装

创建 Python 环境

克隆 LLaMA-Factory 项目

安装依赖

启动服务

三、支持的算法

更多推荐文章

相关免费在线工具

四、性能指标

五、配置与微调示例

1. 准备数据集

2. 注册数据集

3. 编写配置文件

4. 启动 Web UI 服务

5. 配置微调参数

6. 开始微调

7. 评估模型

更多推荐文章

相关免费在线工具

LLaMA-Factory 大语言模型微调框架详解与使用指南

LLaMA-Factory：大语言模型微调框架

一、功能特点

二、安装

创建 Python 环境

克隆 LLaMA-Factory 项目

安装依赖

启动服务

三、支持的算法

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

四、性能指标

五、配置与微调示例

1. 准备数据集

2. 注册数据集

3. 编写配置文件

4. 启动 Web UI 服务

5. 配置微调参数

6. 开始微调

7. 评估模型

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具