基于魔塔社区环境从零微调 Yi 开源大模型实战
大模型微调通常被认为需要昂贵的 GPU 硬件和复杂的本地环境配置,但这并非绝对。借助云端集成开发环境,开发者仅需一个浏览器即可从零开始完成大模型的微调流程。本文将详细介绍如何利用阿里魔塔社区(ModelScope)提供的免费 GPU 资源,使用 LLaMA-Factory 框架对零一万物的 Yi-1.5-6B 开源大语言模型进行微调。
1. 账号与环境准备
首先,你需要注册并登录魔搭社区账号:https://modelscope.cn/home
登录后,访问目标模型页面: https://www.modelscope.cn/models/01ai/Yi-1.5-6B
在模型详情页选择方式二:GPU 环境,点击'启动'。启动过程约需 2 分钟,待环境就绪后点击"查看 Notebook"进入。
魔塔社区内置了 JupyterLab 功能。进入后,找到 Notebook 标签页,新建一个 Notebook 文件(也可以在 Terminal 中直接执行命令)。

安装依赖库
在 Notebook 的代码块中执行以下命令以升级 pip 并安装关键依赖:
!pip3 install --upgrade pip
!pip3 install bitsandbytes>=0.39.0
拉取 LLaMA-Factory
LLaMA-Factory 是一款开源的低代码大模型微调框架,集成了业界广泛使用的微调技术。克隆该仓库:
!git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
安装框架依赖
接下来需要在 Launcher > Terminal 中执行安装命令。这一步耗时较长,请耐心等待。
# ⚠️下面两行命令在刚启动的 Terminal 中执行⚠️
cd LLaMA-Factory
pip3 install -e ".[torch,metrics]"
2. 下载模型权重
零一万物的 Yi 开源大语言模型权重可在 HuggingFace 和 ModelScope 上获取。此处选择从 ModelScope 下载,速度更稳定。
所有开源模型链接:https://www.modelscope.cn/organization/01ai/
本次实验选用最小的 Yi-1.5-6B-Chat 模型,大小约 12G,下载时间视网络状况而定。
在 Notebook 或 Terminal 中执行以下命令下载模型:
!git clone https://www.modelscope.cn/01ai/Yi-1.5-6B-Chat.git
等待下载完成后,模型文件将位于当前目录下的 Yi-1.5-6B-Chat 文件夹中。
3. 配置文件修改
准备工作就绪后,开始配置微调参数。在 LLaMA-Factory 文件夹下,打开 目录,找到 文件,复制一份并重命名为 。


