跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像 AI 生图工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

LlamaFactory v0.9.4 正式发布：LLM 微调框架全面升级 | 极客日志

PythonAI算法

LlamaFactory v0.9.4 正式发布：LLM 微调框架全面升级

LlamaFactory v0.9.4 版本发布，主要变更包括仓库名称更新为 LlamaFactory，废弃 Python 3.9/3.10 要求 3.11-3.13，包管理迁移至 uv。新增功能支持正交微调 OFT、语义初始化、Megatron-LM 训练、KTransformers 后端、MPO 算法、FP8 精度及 Transformers v5 等。模型支持扩展至 Falcon H1、Kimi-VL、Qwen3 系列等多模态及文本模型。该版本旨在提供更简单高效的 LLM 微调体验。

云朵棉花糖发布于 2026/4/5更新于 2026/7/2050 浏览

LlamaFactory v0.9.4 版本正式发布。

一、重要变更（Breaking Changes）

本次版本包含多项对使用者影响较大的变更，升级前请务必关注：

项目仓库名称变更 仓库名称已从 LLaMA-Factory 更新为 LlamaFactory，后续所有官方资源将统一使用新名称。
Python 版本要求升级 Python 3.9 与 3.10 已正式废弃。 LlamaFactory 现在要求 Python 3.11 – 3.13。
包管理工具迁移 项目从 pip 迁移至 uv。安装方式更新为：使用 uv pip install llamafactory
官方博客上线 LlamaFactory 官方博客已正式发布： https://blog.llamafactory.net/en/

二、重磅新特性（New Features）

v0.9.4 在算法、训练后端和工程能力上实现了全面增强：

🔥 支持 正交微调（Orthogonal Fine-Tuning, OFT）
🔥 支持 新增 Token 的语义初始化（Semantic Initialization）
🔥 支持通过 MCoreAdapter 进行 Megatron-LM 训练
🔥 支持 KTransformers 后端
支持 MPO 算法
支持 FP8 精度训练
支持 Transformers v5
支持在函数调用消息中同时使用 推理内容与纯文本
支持 DeepSpeed AutoTP
支持 高效的 NPU 融合算子
支持 TRL 0.24

这些新特性进一步提升了 LlamaFactory 在大规模模型训练、分布式效率、硬件适配以及前沿算法支持方面的能力。

三、模型支持更新（Models）

v0.9.4 新增与扩展了大量前沿模型与多模态模型支持，覆盖文本、视觉及多任务场景：

Falcon H1
Kimi-VL
GLM-4.5V
Gemma3n
Granite4
Qwen3-2507
MiniCPM-V 4.0
Intern-S1-mini
Seed-OSS
MiniCPM-V 4.5
InternVL-3.5
ERNIE-4.5-Text
ERNIE-4.5-VL
Ling-V2
Qwen3-VL
Qwen3-Omni
Hunyuan-mt
GLM-4.6V
Ministral 3
VibeThinker
MiMo-V2-Flash
MiniMax-M1
MiniMax-M2

该版本在多模态、视觉语言建模和新一代通用模型支持方面达到了新的高度。

四、总结

代码地址：github.com/hiyouga/LlamaFactory

LlamaFactory v0.9.4 是一次关键版本更新：

Python、工具链与训练体系全面升级
覆盖最新算法、硬件能力与模型生态
继续坚持'简单 + 高效'的 LLM 微调理念

目录

一、重要变更（Breaking Changes）
二、重磅新特性（New Features）
三、模型支持更新（Models）
四、总结

免费图片AI生成工具免费生成了解详情

Magick API 一键接入全球大模型注册送1000万token查看
免费图片视频在线生成30秒，将你的创意变成现实开始设计
X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
100+免费在线小游戏爽一把

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

Neo4j Desktop 安装与使用指南：本地实例、远程连接及数据导入
Moon VR Video Player 使用教程：支持 8K/12K 多音轨与外挂字幕
C++ 智能指针详解：原理、实现与内存管理最佳实践
this、箭头函数与普通函数：前端实战避坑指南
VLM Unlearning 技术路线论文综述
大模型基础知识：分词与提示工程详解
AIGC 个性化与定制化内容生成：技术与应用
Qwen3-VL 视觉模型微调实战：LLaMA-Factory 与 WEBUI 部署
VS Code + WSL 环境下 GitHub 及 Copilot 连接异常修复方案
Python 七大就业方向详解：从 Web 开发到人工智能
AI 产品经理入门指南：从基础到进阶
AI 短视频分镜头设计：主流 AI 绘画工具选择指南
YOLO 无人机目标检测实战：7261 张数据集与 QT 可视化界面实现
Ubuntu 24.04 安装 OpenClaw 集成 Kimi 与飞书教程
AI 辅助构建高可用电商系统核心架构实战指南
Linux 进程间通信进阶：消息队列与信号量详解
零基础转行网络安全就业前景与技能要求分析
MyBatisPlus 与 Thymeleaf 全栈分页整合实战
AI 图像生成技术指南：从原理到实战
Python 基础语法完全指南：变量、类型、运算符与字符串

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online