大模型微调实战指南:基于 LLaMA-Factory 从零微调 Yi 模型
前言
大模型微调(Fine-tuning)是个性化定制 AI 能力的关键步骤。通过微调,可以让通用大模型适应特定领域的知识或特定的对话风格。本文将以零一万物的 Yi-1.5-6B 开源模型为例,使用 LLaMA-Factory 框架,在云端 GPU 环境下演示完整的微调流程。
本指南适合希望了解大模型微调基本流程的开发者。我们将涵盖环境准备、模型下载、配置文件编写、训练执行及推理测试五个核心环节。
1. 账号和环境准备
微调大模型通常需要高性能 GPU 资源。为了降低门槛,我们推荐使用 ModelScope(魔搭社区)提供的免费 GPU 算力环境。
1.1 注册与登录
- 访问 ModelScope 官网并注册账号。
- 登录后进入个人主页。
- 申请开通免费 GPU 算力资源(新用户通常有试用额度)。
1.2 启动开发环境
- 在 ModelScope 模型页找到目标模型页面(例如 Yi-1.5-6B-Chat)。
- 选择方式二:GPU 环境,点击'启动'。
- 等待约 2 分钟,环境初始化完成后点击'查看 Notebook'进入 JupyterLab 界面。
- 在 Notebook 标签页新建一个空白 Notebook,或在 Terminal 中直接操作。
1.3 安装依赖库
在 Notebook 的代码单元格中执行以下命令,确保 Python 环境及基础库更新:
!pip3 install --upgrade pip
!pip3 install bitsandbytes>=0.39.0
随后拉取 LLaMA-Factory 项目仓库:
!git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
进入目录并安装框架依赖(此步骤耗时较长,请耐心等待):
cd LLaMA-Factory
pip3 install -e ".[torch,metrics]"
2. 下载基座模型
本次实验选用 Yi-1.5-6B-Chat 作为基座模型。该模型权重可在 HuggingFace 或 ModelScope 获取,建议优先从 ModelScope 下载以加速国内网络访问。
2.1 模型克隆
在终端或 Notebook 中执行以下命令克隆模型仓库:
!git clone https://www.modelscope.cn/01ai/Yi-1.5-6B-Chat.git
注意:模型文件较大(约 12GB),下载时间取决于网络状况。
2.2 验证模型路径
确认模型已下载至当前目录下的 Yi-1.5-6B-Chat 文件夹内,后续配置中将引用此路径。
3. 微调实战配置
LLaMA-Factory 提供了丰富的微调脚本和配置文件。我们将使用 QLoRA 技术进行高效微调,该方法能显著降低显存占用。
3.1 创建配置文件
在 LLaMA-Factory/examples/train_qlora 目录下,复制一份示例配置文件 llama3_lora_sft_awq.yaml,并重命名为 yi_lora_sft_bitsandbytes.yaml。
3.2 修改关键参数
打开新创建的 YAML 文件,重点修改以下内容:


