大模型微调工具推荐：LLaMA-Factory 使用指南

近日，国内的一款微调框架发布了论文《LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models》，对其框架做了系统性的总结。该框架自推出后迅速流行，现已斩获大量 Star，逐步成为当下微调的首选工具。

LLaMA-Factory Logo

模型微调相较于上下文学习（In-Context Learning）来讲，存在比较高的门槛，但又是模型专业化、领域化不可或缺的技术手段。其复杂性主要体现在以下几个方面：

理论基础：如果说基于大模型写 Prompt 构建 RAG 或 Agent 不需要太多机器学习理论知识，然而微调就必须对样本、学习率、Loss 等有深入理解。
数据准备：对于普通开发者，高质量的数据是微调成功的关键保证。如何预处理、清洗、标注这些样本本身就很复杂，因此诞生了大模型数据工程这样的领域来解决这一问题。
基座模型分化：虽然当下很多模型都参考 LLaMA 和 HuggingFace 的一些规范，但是仍然有一些特殊之处，想要微调也需要针对性地去分析和构建相应的策略。
超参数优化：微调本身是一个'炼丹'过程，如何能够找到合适的超参数以达到最佳性能，是一个重大挑战。
AI 工程复杂性：涉及到硬件、软件、复杂流程的协同配合以及系统优化，在有限的成本、资源和时间要求下完成模型训练过程。

正是因为这些原因，对于预训练微调，需要一个类似于工厂的工业化手段来降低门槛，提升效率。

行业内出现了很多微调框架，而 LLaMA-Factory 便是其中之一，从命名上就可以看出它们的目标是成为模型微调的工厂。

LLaMA-Factory Interface

它得以流行主要得益于支持当下主流的大模型（如百川、千问、LLaMA 等），不仅集成了大模型预训练、监督微调和强化微调等阶段的主流微调技术（支持 LoRA 和 QLoRA 等参数高效微调策略），还提供了预训练、指令微调等丰富的数据集方便参考使用。最重要的是提供了一个无代码的图形界面，大幅降低使用门槛，非开发者也可以方便地完成模型微调。

架构组成

该框架架构上主要由四个模块构成：模型加载器、数据工作器、训练器，以及用户界面 LlamaBoard。

Architecture Diagram

安装与环境配置

在使用 LLaMA-Factory 之前，需要确保环境满足基本要求。推荐使用 Python 3.8+ 环境，并安装必要的依赖库。

# 克隆仓库
git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

# 安装依赖
pip install -e ".[torch]"

根据官方文档安装好 LLaMA-Factory 后，可以有三种方式进行操作：WebUI、CLI 或者 Python API。

1. WebUI 方式

这是最便捷的方式，适合快速验证和调试。

{ "数据集名称": { "hf_hub_url": "Hugging Face 的数据集仓库地址（若指定，则忽略 script_url 和 file_name）", "ms_hub_url": "ModelScope 的数据集仓库地址（若指定，则忽略 script_url 和 file_name）", "script_url": "包含数据加载脚本的本地文件夹名称（若指定，则忽略 file_name）", "file_name": "该目录下数据集文件的名称（若上述参数未指定，则此项必需）", "file_sha1": "数据集文件的 SHA-1 哈希值（可选，留空不影响训练）", "subset": "数据集子集的名称（可选，默认：None）", "folder": "Hugging Face 仓库的文件夹名称（可选，默认：None）", "ranking": "是否为偏好数据集（可选，默认：False）", "formatting": "数据集格式（可选，默认：alpaca，可以为 alpaca 或 sharegpt）", "columns": { "prompt": "数据集代表提示词的表头名称（默认：instruction）", "query": "数据集代表请求的表头名称（默认：input）", "response": "数据集代表回答的表头名称（默认：output）", "history": "数据集代表历史对话的表头名称（默认：None）", "messages": "数据集代表消息列表的表头名称（默认：conversations）", "system": "数据集代表系统提示的表头名称（默认：None）", "tools": "数据集代表工具描述的表头名称（默认：None）" }, "tags": { "role_tag": "消息中代表发送者身份的键名（默认：from）", "content_tag": "消息中代表文本内容的键名（默认：value）", "user_tag": "消息中代表用户的 role_tag（默认：human）", "assistant_tag": "消息中代表助手的 role_tag（默认：gpt）", "observation_tag": "消息中代表工具返回结果的 role_tag（默认：observation）", "function_tag": "消息中代表工具调用的 role_tag（默认：function_call）", "system_tag": "消息中代表系统提示的 role_tag（默认：system，会覆盖 system 列）" } } }

大模型微调工具推荐：LLaMA-Factory 使用指南

架构组成

安装与环境配置

1. WebUI 方式

更多推荐文章

相关免费在线工具

2. CLI 命令行方式

3. 编程方式 (Python API)

数据集配置

训练与评估

小结

更多推荐文章

相关免费在线工具

大模型微调工具推荐：LLaMA-Factory 使用指南

架构组成

安装与环境配置

1. WebUI 方式

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. CLI 命令行方式

3. 编程方式 (Python API)

数据集配置

训练与评估

小结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具