基于魔塔社区环境从零微调 Yi 开源大模型实战

大模型微调通常被认为需要昂贵的 GPU 硬件和复杂的本地环境配置，但这并非绝对。借助云端集成开发环境，开发者仅需一个浏览器即可从零开始完成大模型的微调流程。本文将详细介绍如何利用阿里魔塔社区（ModelScope）提供的免费 GPU 资源，使用 LLaMA-Factory 框架对零一万物的 Yi-1.5-6B 开源大语言模型进行微调。

1. 账号与环境准备

首先，你需要注册并登录魔搭社区账号：https://modelscope.cn/home

登录后，访问目标模型页面： https://www.modelscope.cn/models/01ai/Yi-1.5-6B

在模型详情页选择方式二：GPU 环境，点击'启动'。启动过程约需 2 分钟，待环境就绪后点击"查看 Notebook"进入。

魔塔社区内置了 JupyterLab 功能。进入后，找到 Notebook 标签页，新建一个 Notebook 文件（也可以在 Terminal 中直接执行命令）。

步骤截图

安装依赖库

在 Notebook 的代码块中执行以下命令以升级 pip 并安装关键依赖：

!pip3 install --upgrade pip
!pip3 install bitsandbytes>=0.39.0

拉取 LLaMA-Factory

LLaMA-Factory 是一款开源的低代码大模型微调框架，集成了业界广泛使用的微调技术。克隆该仓库：

!git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

安装框架依赖

接下来需要在 Launcher > Terminal 中执行安装命令。这一步耗时较长，请耐心等待。

# ⚠️下面两行命令在刚启动的 Terminal 中执行⚠️
cd LLaMA-Factory
pip3 install -e ".[torch,metrics]"

2. 下载模型权重

零一万物的 Yi 开源大语言模型权重可在 HuggingFace 和 ModelScope 上获取。此处选择从 ModelScope 下载，速度更稳定。

所有开源模型链接：https://www.modelscope.cn/organization/01ai/

本次实验选用最小的 Yi-1.5-6B-Chat 模型，大小约 12G，下载时间视网络状况而定。

在 Notebook 或 Terminal 中执行以下命令下载模型：

!git clone https://www.modelscope.cn/01ai/Yi-1.5-6B-Chat.git

等待下载完成后，模型文件将位于当前目录下的 Yi-1.5-6B-Chat 文件夹中。

3. 配置文件修改

准备工作就绪后，开始配置微调参数。在 LLaMA-Factory 文件夹下，打开目录，找到文件，复制一份并重命名为。

基于魔塔社区环境从零微调 Yi 开源大模型实战