LLaMA-Factory 微调 GPT-OSS-20B 模型实战（LoRA 版）

本教程详细讲解如何在 AutoDL 云 GPU 上使用 LLaMA-Factory 框架微调 GPT-OSS-20B 大语言模型，包含完整的环境配置、训练流程、权重合并以及 vLLM 推理部署全流程。

前言

在智能采购等垂直场景项目中，需要对大语言模型进行微调以理解业务需求。对比多种方案后，选择 LLaMA-Factory + LoRA 的组合主要基于以下考量：

开箱即用：LLaMA-Factory 提供了完善的训练框架，支持多种微调方式。
显存友好：LoRA 相比全参数微调，显存占用大幅降低。
效果不错：在特定对话场景下，LoRA 微调已能满足业务需求。

本文将完整记录从环境配置到模型部署的全过程。

一、方案概览

组件	选择	说明
微调框架	LLaMA-Factory 0.9.4	开源的大模型训练框架
基础模型	GPT-OSS-20B	200 亿参数的 MoE 大模型
微调方式	LoRA	低秩适配，显存友好
推理引擎	vLLM	高性能推理加速
实验监控	SwanLab	可视化训练过程
GPU 资源	AutoDL H20	性价比较高的云 GPU
远程传文件	WinSCP	用于本地与远程服务器之间加密上传、下载、管理文件

二、环境配置

在 AutoDL 租用实例时，镜像配置非常关键，选错了会导致各种兼容性问题。

推荐配置：

参数	选择	说明
基础镜像	PyTorch
Ubuntu	22.04
Python	3.12	必须 3.11+，LLaMA-Factory 要求
CUDA	12.8	版本不能太低
PyTorch	2.8.0

⚠️ 重要提醒：GPT-OSS 模型默认会尝试使用 Flash Attention 3，但该特性目前仅支持 Hopper 架构 GPU（如 H100/H800 等）。

三、项目初始化

3.1 克隆 LLaMA-Factory


 /root/autodl-tmp

 -p /root/autodl-tmp

wget https://github.com/hiyouga/LLaMA-Factory/archive/refs/tags/v0.9.4.zip
unzip v0.9.4.zip
 LlamaFactory-0.9.4 LLaMA-Factory

方式	优点	缺点
合并后推理	配置简单，推理速度快	需要额外合并步骤
LoRA 直接加载	无需合并步骤	配置稍复杂

对比项	方案一（LoRA 直接加载）	方案二（合并后使用）
是否需要合并	❌ 不需要	✅ 需要
配置复杂度	稍复杂	简单
推理速度	稍慢	快
显存占用	略高	略低
灵活切换 LoRA	✅ 支持	❌ 不支持
推荐场景	开发测试	生产部署

LLaMA-Factory 微调 GPT-OSS-20B 模型实战（LoRA 版）

LLaMA-Factory 微调 GPT-OSS-20B 模型实战（LoRA 版）

前言

一、方案概览

二、环境配置

三、项目初始化

3.1 克隆 LLaMA-Factory

更多推荐文章

相关免费在线工具

3.2 安装依赖

3.3 下载基础模型

3.4 安装 SwanLab

四、训练配置

4.1 数据集准备

4.2 配置文件

4.3 训练步数计算

4.4 开始训练

五、权重合并（可选）

5.1 为什么要合并？

5.2 合并命令

六、vLLM 推理部署

6.1 安装 vLLM

6.2 方案一：直接加载 LoRA（不合并权重）⭐推荐

6.3 方案二：使用合并后的模型

6.4 两种方案对比

七、常见问题汇总

问题 1：Token 不匹配错误

问题 2：Python 版本不匹配

八、总结

更多推荐文章

相关免费在线工具

LLaMA-Factory 微调 GPT-OSS-20B 模型实战（LoRA 版）

LLaMA-Factory 微调 GPT-OSS-20B 模型实战（LoRA 版）

前言

一、方案概览

二、环境配置

三、项目初始化

3.1 克隆 LLaMA-Factory

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 安装依赖

3.3 下载基础模型

3.4 安装 SwanLab

四、训练配置

4.1 数据集准备

4.2 配置文件

4.3 训练步数计算

4.4 开始训练

五、权重合并（可选）

5.1 为什么要合并？

5.2 合并命令

六、vLLM 推理部署

6.1 安装 vLLM

6.2 方案一：直接加载 LoRA（不合并权重）⭐推荐

6.3 方案二：使用合并后的模型

6.4 两种方案对比

七、常见问题汇总

问题 1：Token 不匹配错误

问题 2：Python 版本不匹配

八、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具