跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

LlamaFactory v0.9.4 正式发布：LLM 微调框架全面升级 | 极客日志

PythonAI算法

LlamaFactory v0.9.4 正式发布：LLM 微调框架全面升级

综述由AI生成LlamaFactory v0.9.4 版本于 2025 年 12 月 31 日发布，定位为不可变发布版本。主要变更包括仓库名称更新、Python 版本要求升至 3.11-3.13、包管理迁移至 uv 以及官方博客上线。新特性涵盖正交微调（OFT）、语义初始化、Megatron-LM 训练支持、KTransformers 后端、MPO 算法、FP8 精度训练等。模型支持扩展了 Falcon H1、Kimi-VL、Qwen3 系列等多款前沿文本及多模态模型。此次更新强化了大规模模型训练、分布式效率及硬件适配能力。

云间漫步发布于 2026/4/6更新于 2026/5/2529 浏览

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

2025 年 12 月 31 日，LlamaFactory 正式发布 v0.9.4 版本。该版本被官方定义为不可变发布版本（Immutable Release），仅允许修改发布标题和发布说明内容。

以下是 LlamaFactory v0.9.4 的完整更新内容详解。

一、重要变更（Breaking Changes）

本次版本包含多项对使用者影响较大的变更，升级前请务必关注：

项目仓库名称变更 仓库名称已从 LLaMA-Factory 更新为 LlamaFactory，后续所有官方资源将统一使用新名称。
Python 版本要求升级 Python 3.9 与 3.10 已正式废弃。 LlamaFactory 现在要求 Python 3.11 – 3.13。
包管理工具迁移 项目从 pip 迁移至 uv。安装方式更新为：使用 uv pip install llamafactory
官方博客上线 LlamaFactory 官方博客已正式发布： https://blog.llamafactory.net/en/

二、重磅新特性（New Features）

v0.9.4 在算法、训练后端和工程能力上实现了全面增强：

🔥 支持正交微调（Orthogonal Fine-Tuning, OFT）
🔥 支持新增 Token 的语义初始化（Semantic Initialization）
🔥 支持通过 MCoreAdapter 进行 Megatron-LM 训练
🔥 支持 KTransformers 后端
支持 MPO 算法
支持 FP8 精度训练
支持 Transformers v5
支持在函数调用消息中同时使用推理内容与纯文本
支持 DeepSpeed AutoTP
支持高效的 NPU 融合算子
支持 TRL 0.24

这些新特性进一步提升了 LlamaFactory 在大规模模型训练、分布式效率、硬件适配以及前沿算法支持方面的能力。

三、模型支持更新（Models）

v0.9.4 新增与扩展了大量前沿模型与多模态模型支持，覆盖文本、视觉及多任务场景：

Falcon H1
Kimi-VL
GLM-4.5V
Gemma3n
Granite4
Qwen3-2507
MiniCPM-V 4.0
Intern-S1-mini

Seed-OSS

MiniCPM-V 4.5

InternVL-3.5

ERNIE-4.5-Text

ERNIE-4.5-VL

Ling-V2

Qwen3-VL

Qwen3-Omni

Hunyuan-mt

GLM-4.6V

Ministral 3

VibeThinker

MiMo-V2-Flash

MiniMax-M1

MiniMax-M2

该版本在多模态、视觉语言建模和新一代通用模型支持方面达到了新的高度。

四、总结

代码地址：https://github.com/hiyouga/LlamaFactory

LlamaFactory v0.9.4 是一次关键版本更新：

Python、工具链与训练体系全面升级
覆盖最新算法、硬件能力与模型生态
继续坚持'简单 + 高效'的 LLM 微调理念

该版本适用于正在进行或计划进行大模型训练与微调的用户。

目录

一、重要变更（Breaking Changes）
二、重磅新特性（New Features）
三、模型支持更新（Models）
四、总结

💰 8折买阿里云服务器限时8折了解详情

Magick API 一键接入全球大模型注册送1000万token查看
🤖 一键搭建Deepseek满血版了解详情
一键打造专属AI 智能体了解详情

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

基于 Cursor 的 Web 背单词应用开发实战
LeetCode 92 链表区间反转：递归反转与哨兵技巧
Spring 核心技术解析：Spring-Jcl 日志模块详解
基于 Go 与 DeepSeek 的 AIOps 监控系统实战
Web 自动化测试实战：常用函数全解析与场景化应用指南
DevOps、Git 与 GitLab 核心概念及实践
Linux 进程替换详解：从 fork 到 exec 的完整链路
网络安全 SRC 漏洞挖掘实战与入门指南
最长有效括号：Python 动态规划解法
生成式人工智能与大语言模型在医疗保健领域的全面融合路线图
Linux 环境下 OpenClaw 快速安装、初始化与 Web UI 配置
OpenSpec 实战：用规范驱动开发破解 AI 编程协作难题
Git 入门教程
AutoFigure：从长文本自动生成高质量科研插图
Java 对象更新时避免空字段覆盖的几种拷贝方案
Spatial Joy 2025 全球 AR&AI 赛事参赛指南：资源、玩法与避坑
AI 时代前端设计稿生成实战：三种高效工具流
SeaTunnel Web 可视化数据集成平台教程
鸿蒙应用开发入门：ArkTS 与 ArkUI 实战路径解析
Mem0 大语言模型集成指南：支持 OpenAI Groq AWS 等多种模型

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online