基于魔搭社区环境从零开始微调 Yi 开源大模型
大模型微调本身是一项技术门槛较高的任务,涉及 GPU 资源、依赖配置及参数调优。为了降低入门难度,本文将演示如何在阿里云魔搭(ModelScope)社区提供的免费集成环境中,使用 LLaMA-Factory 框架对零一万物(01AI)的 Yi-1.5-6B 开源大语言模型进行微调。
本教程无需本地高性能显卡,只需浏览器即可完成全流程操作。
1. 账号与环境准备
首先访问魔搭社区注册并登录账号: https://modelscope.cn/home
登录后进入目标模型页面: https://www.modelscope.cn/models/01ai/Yi-1.5-6B
点击'在线运行'或类似入口,选择方式二:GPU 环境并点击'启动'。等待约 2 分钟环境初始化完成后,点击'查看 Notebook'进入开发界面。
魔搭社区内置 JupyterLab 功能。在 Notebook 标签页新建一个 Notebook 文件,或在 Terminal 中执行命令。
安装基础依赖
在 Notebook 代码块中执行以下命令升级 pip 并安装量化库:
!pip3 install --upgrade pip
!pip3 install bitsandbytes>=0.39.0
拉取 LLaMA-Factory
LLaMA-Factory 是一款集成了业界广泛微调技术的开源低代码框架。克隆仓库:
!git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
安装框架依赖
切换到 Launcher > Terminal,进入 LLaMA-Factory 目录并安装依赖(耗时较长):
cd LLaMA-Factory
pip3 install -e ".[torch,metrics]"
2. 下载模型权重
Yi-1.5-6B-Chat 模型权重可在 ModelScope 获取。该模型大小约 12GB,下载时间视网络状况而定。
在 Notebook 或 Terminal 中执行:
!git clone https://www.modelscope.cn/01ai/Yi-1.5-6B-Chat.git
3. 配置文件详解
微调的核心在于配置文件。在 examples/train_qlora 目录下找到 llama3_lora_sft_awq.yaml,复制并重命名为 yi_lora_sft_bitsandbytes.yaml。
打开该文件,修改关键参数:
### model
model_name_or_path: ../Yi-1.5-6B-Chat
template: chatml
finetuning_type: lora
### dataset
dataset:


