LlamaFactory v0.9.4 发布：支持正交微调与多模态模型升级 | 极客日志

PythonAI算法

LlamaFactory v0.9.4 发布：支持正交微调与多模态模型升级

综述由AI生成LlamaFactory v0.9.4 版本正式推出，作为不可变发布版本，重点更新了 Python 环境要求至 3.11-3.13，并迁移包管理工具至 uv。新增正交微调（OFT）、语义初始化及 MCoreAdapter 训练支持，适配 KTransformers 后端与 FP8 精度。模型库扩展涵盖 Falcon H1、Kimi-VL、Qwen3 系列等多模态及文本模型，强化分布式效率与硬件适配能力。

SqlMaster发布于 2026/4/11更新于 2026/5/2313 浏览

LlamaFactory v0.9.4 版本更新详解

2025 年 12 月 31 日，LlamaFactory 正式发布 v0.9.4 版本。这是一个具有里程碑意义的不可变发布版本（Immutable Release），仅允许修改发布标题和说明内容。该版本标志着 LLM 微调框架在工具链、算法支持与硬件适配上的全面进化。

重要变更

升级前请务必关注以下破坏性变更：

项目仓库名称变更：仓库名已从 LLaMA-Factory 更新为 LlamaFactory，后续官方资源将统一使用新名称。
Python 版本要求升级：Python 3.9 与 3.10 已正式废弃，现要求 Python 3.11 – 3.13。
包管理工具迁移：项目从 pip 迁移至 uv。安装命令更新为：
```
uv pip install llamafactory
```
官方博客上线：官方文档博客已发布，可访问 https://blog.llamafactory.net/en/ 获取最新技术文章。

新增功能

本次更新在算法、训练后端及工程能力上实现了显著增强：

🔥 支持 正交微调（Orthogonal Fine-Tuning, OFT）
🔥 支持 新增 Token 的语义初始化（Semantic Initialization）
🔥 支持通过 MCoreAdapter 进行 Megatron-LM 训练
🔥 支持 KTransformers 后端
支持 MPO 算法
支持 FP8 精度训练
支持 Transformers v5
支持在函数调用消息中同时使用 推理内容与纯文本
支持 DeepSpeed AutoTP
支持 高效的 NPU 融合算子
支持 TRL 0.24

这些特性进一步提升了大规模模型训练的分布式效率及前沿算法的落地能力。

模型支持扩展

v0.9.4 新增与扩展了大量前沿模型，覆盖文本、视觉及多任务场景：

Falcon H1, Kimi-VL, GLM-4.5V, Gemma3n
Granite4, Qwen3-2507, MiniCPM-V 4.0, Intern-S1-mini
Seed-OSS, MiniCPM-V 4.5, InternVL-3.5
ERNIE-4.5-Text, ERNIE-4.5-VL, Ling-V2
Qwen3-VL, Qwen3-Omni, Hunyuan-mt
GLM-4.6V, Ministral 3, VibeThinker
MiMo-V2-Flash, MiniMax-M1, MiniMax-M2

总结

LlamaFactory v0.9.4 是一次承前启后的关键版本。它告别了旧有的工具链限制，面向未来全面进化：

Python 环境、工具链与训练体系全面升级
覆盖最新算法、硬件能力与模型生态
继续坚持'简单 + 高效'的 LLM 微调理念

代码地址：https://github.com/hiyouga/LlamaFactory