LlamaFactory v0.9.4 版本正式发布。
一、重要变更(Breaking Changes)
本次版本包含多项对使用者影响较大的变更,升级前请务必关注:
- 项目仓库名称变更 仓库名称已从 LLaMA-Factory 更新为 LlamaFactory,后续所有官方资源将统一使用新名称。
- Python 版本要求升级 Python 3.9 与 3.10 已正式废弃。 LlamaFactory 现在要求 Python 3.11 – 3.13。
- 包管理工具迁移
项目从 pip 迁移至 uv。
安装方式更新为:
使用
uv pip install llamafactory - 官方博客上线 LlamaFactory 官方博客已正式发布: https://blog.llamafactory.net/en/
二、重磅新特性(New Features)
v0.9.4 在算法、训练后端和工程能力上实现了全面增强:
- 🔥 支持 正交微调(Orthogonal Fine-Tuning, OFT)
- 🔥 支持 新增 Token 的语义初始化(Semantic Initialization)
- 🔥 支持通过 MCoreAdapter 进行 Megatron-LM 训练
- 🔥 支持 KTransformers 后端
- 支持 MPO 算法
- 支持 FP8 精度训练
- 支持 Transformers v5
- 支持在函数调用消息中同时使用 推理内容与纯文本
- 支持 DeepSpeed AutoTP
- 支持 高效的 NPU 融合算子
- 支持 TRL 0.24
这些新特性进一步提升了 LlamaFactory 在大规模模型训练、分布式效率、硬件适配以及前沿算法支持方面的能力。
三、模型支持更新(Models)
v0.9.4 新增与扩展了大量前沿模型与多模态模型支持,覆盖文本、视觉及多任务场景:
- Falcon H1
- Kimi-VL
- GLM-4.5V
- Gemma3n
- Granite4
- Qwen3-2507
- MiniCPM-V 4.0
- Intern-S1-mini
- Seed-OSS
- MiniCPM-V 4.5
- InternVL-3.5
- ERNIE-4.5-Text
- ERNIE-4.5-VL
- Ling-V2
- Qwen3-VL
- Qwen3-Omni
- Hunyuan-mt
- GLM-4.6V
- Ministral 3
- VibeThinker
- MiMo-V2-Flash
- MiniMax-M1
- MiniMax-M2
该版本在多模态、视觉语言建模和新一代通用模型支持方面达到了新的高度。
四、总结
代码地址:github.com/hiyouga/LlamaFactory
LlamaFactory v0.9.4 是一次关键版本更新:

