从零开始微调大模型:基于 LLaMA-Factory 的实战指南
大模型微调本身是一项技术难度较高的任务,但对于初学者而言,理解其基本流程至关重要。本文将手把手带你从零开始,利用阿里魔搭社区提供的集成环境,完成一次完整的大模型微调过程。无需本地高配 GPU,只需浏览器即可操作。
本次微调的目标模型为零一万物的 Yi-1.5-6B 开源大语言模型。虽然不同模型的微调细节略有差异,但核心原理与流程基本一致。
1. 账号和环境准备
首先,你需要注册并登录魔搭(ModelScope)账号: https://modelscope.cn/home
注册完成后,访问目标模型页面: https://www.modelscope.cn/models/01ai/Yi-1.5-6B
点击"在线运行"或类似入口,选择方式二:GPU 环境,点击"启动"。启动过程约需 2 分钟,待环境就绪后点击"查看 Notebook"进入。
魔搭社区内置了 JupyterLab 功能。进入后,在左侧导航栏找到 Notebook 标签,新建一个 Notebook 页面(也可以在 Terminal 中直接执行命令)。
安装依赖库
在 Notebook 代码块中执行以下命令安装基础依赖:
!pip3 install --upgrade pip
!pip3 install bitsandbytes>=0.39.0
拉取 LLaMA-Factory
LLaMA-Factory 是一款开源低代码大模型微调框架,集成了业界广泛使用的微调技术。执行以下命令拉取源码:
!git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
安装框架依赖
接下来需要在 Launcher > Terminal 中执行安装命令。这一步耗时较长,请耐心等待。
# ⚠️下面两行命令在刚启动的 Terminal 中执行⚠️
cd LLaMA-Factory
pip3 install -e ".[torch,metrics]"
2. 下载模型
零一万物的 Yi 开源大语言模型权重可在 HuggingFace 和 ModelScope 上找到。这里选择从 ModelScope 下载。
所有开源模型链接: https://www.modelscope.cn/organization/01ai/
本实验选用最小的 Yi-1.5-6B-Chat 模型进行验证。模型说明文档: https://www.modelscope.cn/models/01ai/Yi-1.5-6B-Chat/summary
Yi-1.5-6B-Chat 模型大小约 12G,下载时间视网络情况而定。在 Notebook 中执行以下命令下载:
!git clone https://www.modelscope.cn/01ai/Yi-1.5-6B-Chat.git
3. 配置微调参数
准备工作完成后,即可开始微调。虽然本文仅演示基础流程,但实际微调效果受数据质量、超参数影响较大。
创建配置文件
在 LLaMA-Factory 文件夹下,打开 examples/train_qlora 目录,找到 文件。复制一份并重命名为 。


