从零开始微调大模型：基于 LLaMA-Factory 的实战指南

大模型微调本身是一项技术难度较高的任务，但对于初学者而言，理解其基本流程至关重要。本文将手把手带你从零开始，利用阿里魔搭社区提供的集成环境，完成一次完整的大模型微调过程。无需本地高配 GPU，只需浏览器即可操作。

本次微调的目标模型为零一万物的 Yi-1.5-6B 开源大语言模型。虽然不同模型的微调细节略有差异，但核心原理与流程基本一致。

1. 账号和环境准备

首先，你需要注册并登录魔搭（ModelScope）账号： https://modelscope.cn/home

注册完成后，访问目标模型页面： https://www.modelscope.cn/models/01ai/Yi-1.5-6B

点击"在线运行"或类似入口，选择方式二：GPU 环境，点击"启动"。启动过程约需 2 分钟，待环境就绪后点击"查看 Notebook"进入。

魔搭社区内置了 JupyterLab 功能。进入后，在左侧导航栏找到 Notebook 标签，新建一个 Notebook 页面（也可以在 Terminal 中直接执行命令）。

安装依赖库

在 Notebook 代码块中执行以下命令安装基础依赖：

!pip3 install --upgrade pip
!pip3 install bitsandbytes>=0.39.0

拉取 LLaMA-Factory

LLaMA-Factory 是一款开源低代码大模型微调框架，集成了业界广泛使用的微调技术。执行以下命令拉取源码：

!git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

安装框架依赖

接下来需要在 Launcher > Terminal 中执行安装命令。这一步耗时较长，请耐心等待。

# ⚠️下面两行命令在刚启动的 Terminal 中执行⚠️
cd LLaMA-Factory
pip3 install -e ".[torch,metrics]"

2. 下载模型

零一万物的 Yi 开源大语言模型权重可在 HuggingFace 和 ModelScope 上找到。这里选择从 ModelScope 下载。

所有开源模型链接： https://www.modelscope.cn/organization/01ai/

本实验选用最小的 Yi-1.5-6B-Chat 模型进行验证。模型说明文档： https://www.modelscope.cn/models/01ai/Yi-1.5-6B-Chat/summary

Yi-1.5-6B-Chat 模型大小约 12G，下载时间视网络情况而定。在 Notebook 中执行以下命令下载：

!git clone https://www.modelscope.cn/01ai/Yi-1.5-6B-Chat.git

3. 配置微调参数

准备工作完成后，即可开始微调。虽然本文仅演示基础流程，但实际微调效果受数据质量、超参数影响较大。

创建配置文件

在 LLaMA-Factory 文件夹下，打开 examples/train_qlora 目录，找到文件。复制一份并重命名为。

从零开始微调大模型：基于 LLaMA-Factory 的实战指南