大模型微调实战指南：基于 LLaMA-Factory 从零微调 Yi 模型

前言

大模型微调（Fine-tuning）是个性化定制 AI 能力的关键步骤。通过微调，可以让通用大模型适应特定领域的知识或特定的对话风格。本文将以零一万物的 Yi-1.5-6B 开源模型为例，使用 LLaMA-Factory 框架，在云端 GPU 环境下演示完整的微调流程。

本指南适合希望了解大模型微调基本流程的开发者。我们将涵盖环境准备、模型下载、配置文件编写、训练执行及推理测试五个核心环节。

1. 账号和环境准备

微调大模型通常需要高性能 GPU 资源。为了降低门槛，我们推荐使用 ModelScope（魔搭社区）提供的免费 GPU 算力环境。

1.1 注册与登录

访问 ModelScope 官网并注册账号。
登录后进入个人主页。
申请开通免费 GPU 算力资源（新用户通常有试用额度）。

1.2 启动开发环境

在 ModelScope 模型页找到目标模型页面（例如 Yi-1.5-6B-Chat）。
选择方式二：GPU 环境，点击'启动'。
等待约 2 分钟，环境初始化完成后点击'查看 Notebook'进入 JupyterLab 界面。
在 Notebook 标签页新建一个空白 Notebook，或在 Terminal 中直接操作。

1.3 安装依赖库

在 Notebook 的代码单元格中执行以下命令，确保 Python 环境及基础库更新：

!pip3 install --upgrade pip
!pip3 install bitsandbytes>=0.39.0

随后拉取 LLaMA-Factory 项目仓库：

!git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

进入目录并安装框架依赖（此步骤耗时较长，请耐心等待）：

cd LLaMA-Factory
pip3 install -e ".[torch,metrics]"

2. 下载基座模型

本次实验选用 Yi-1.5-6B-Chat 作为基座模型。该模型权重可在 HuggingFace 或 ModelScope 获取，建议优先从 ModelScope 下载以加速国内网络访问。

2.1 模型克隆

在终端或 Notebook 中执行以下命令克隆模型仓库：

!git clone https://www.modelscope.cn/01ai/Yi-1.5-6B-Chat.git

注意：模型文件较大（约 12GB），下载时间取决于网络状况。

2.2 验证模型路径

确认模型已下载至当前目录下的 Yi-1.5-6B-Chat 文件夹内，后续配置中将引用此路径。

3. 微调实战配置

LLaMA-Factory 提供了丰富的微调脚本和配置文件。我们将使用 QLoRA 技术进行高效微调，该方法能显著降低显存占用。

3.1 创建配置文件

在 LLaMA-Factory/examples/train_qlora 目录下，复制一份示例配置文件 llama3_lora_sft_awq.yaml，并重命名为 yi_lora_sft_bitsandbytes.yaml。

3.2 修改关键参数

打开新创建的 YAML 文件，重点修改以下内容：

大模型微调实战指南：基于 LLaMA-Factory 从零微调 Yi 模型