基于魔搭社区环境从零开始微调 Yi 开源大模型 | 极客日志

PythonAI算法

基于魔搭社区环境从零开始微调 Yi 开源大模型

综述由AI生成在阿里云魔搭社区免费 GPU 环境下，使用 LLaMA-Factory 框架对零一万物 Yi-1.5-6B 开源大语言模型进行微调的完整流程。内容涵盖账号注册、环境初始化、依赖安装、模型权重下载、配置文件修改、训练脚本执行以及推理测试验证。通过修改数据集实现模型身份认知的自定义，展示了从准备到验证的大模型微调基础操作，并补充了模型合并与部署建议及常见问题排查指南。

极光发布于 2025/2/7更新于 2026/6/340 浏览

基于魔搭社区环境从零开始微调 Yi 开源大模型

大模型微调本身是一项技术门槛较高的任务，涉及 GPU 资源、依赖配置及参数调优。为了降低入门难度，本文将演示如何在阿里云魔搭（ModelScope）社区提供的免费集成环境中，使用 LLaMA-Factory 框架对零一万物（01AI）的 Yi-1.5-6B 开源大语言模型进行微调。

本教程无需本地高性能显卡，只需浏览器即可完成全流程操作。

1. 账号与环境准备

首先访问魔搭社区注册并登录账号： https://modelscope.cn/home

登录后进入目标模型页面： https://www.modelscope.cn/models/01ai/Yi-1.5-6B

点击'在线运行'或类似入口，选择方式二：GPU 环境并点击'启动'。等待约 2 分钟环境初始化完成后，点击'查看 Notebook'进入开发界面。

魔搭社区内置 JupyterLab 功能。在 Notebook 标签页新建一个 Notebook 文件，或在 Terminal 中执行命令。

安装基础依赖

在 Notebook 代码块中执行以下命令升级 pip 并安装量化库：

!pip3 install --upgrade pip
!pip3 install bitsandbytes>=0.39.0

拉取 LLaMA-Factory

LLaMA-Factory 是一款集成了业界广泛微调技术的开源低代码框架。克隆仓库：

!git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

安装框架依赖

切换到 Launcher > Terminal，进入 LLaMA-Factory 目录并安装依赖（耗时较长）：

cd LLaMA-Factory
pip3 install -e ".[torch,metrics]"

2. 下载模型权重

Yi-1.5-6B-Chat 模型权重可在 ModelScope 获取。该模型大小约 12GB，下载时间视网络状况而定。

在 Notebook 或 Terminal 中执行：

!git clone https://www.modelscope.cn/01ai/Yi-1.5-6B-Chat.git

3. 配置文件详解

微调的核心在于配置文件。在 examples/train_qlora 目录下找到 llama3_lora_sft_awq.yaml，复制并重命名为 yi_lora_sft_bitsandbytes.yaml。

打开该文件，修改关键参数：

### model
model_name_or_path: ../Yi-1.5-6B-Chat
template: chatml
finetuning_type: lora

### dataset
dataset:

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

llamafactory-cli train examples/train_qlora/yi_lora_sft_bitsandbytes.yaml

model_name_or_path: ../saves/yi-lora/checkpoint-final
adapter_name_or_path: ../saves/yi-lora
template: chatml
finetuning_type: lora

llamafactory-cli chat examples/inference/yi_lora_sft.yaml

llamafactory-cli export \
    --model_name_or_path ../Yi-1.5-6B-Chat \
    --adapter_name_or_path ../saves/yi-lora \
    --template chatml \
    --export_dir ./merged_model \
    --export_size 2 \
    --export_legacy_format false

基于魔搭社区环境从零开始微调 Yi 开源大模型

基于魔搭社区环境从零开始微调 Yi 开源大模型

1. 账号与环境准备

安装基础依赖

拉取 LLaMA-Factory

安装框架依赖

2. 下载模型权重

3. 配置文件详解

更多推荐文章

相关免费在线工具

4. 开始微调训练

5. 推理测试验证

6. 模型合并与部署建议

合并模型

常见问题排查

7. 总结

更多推荐文章

相关免费在线工具

基于魔搭社区环境从零开始微调 Yi 开源大模型

基于魔搭社区环境从零开始微调 Yi 开源大模型

1. 账号与环境准备

安装基础依赖

拉取 LLaMA-Factory

安装框架依赖

2. 下载模型权重

3. 配置文件详解

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4. 开始微调训练

5. 推理测试验证

6. 模型合并与部署建议

合并模型

常见问题排查

7. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具