跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

腾讯混元图像 3.0 图生图模型开源,LMArena 评测跻身全球第一梯队

腾讯混元团队开源混元图像 3.0 图生图版本,该模型在 LMArena 图像编辑榜单中位列全球第七,是前七名中唯一的开源模型。支持增删改、风格变换、老照片修复及多图融合等功能。基于 80B 总参数规模的混合专家原生多模态架构,采用“先思考,后编辑”流程,结合思维链数据与 MixGRPO 算法优化指令响应。开发者可通过 Github 和 Hugging Face 获取权重及代码,助力社区应用研发。

CoderByte发布于 2026/2/5更新于 2026/6/108.4K 浏览
腾讯混元图像 3.0 图生图模型开源,LMArena 评测跻身全球第一梯队

腾讯混元图像 3.0 图生图模型开源,LMArena 评测跻身全球第一梯队

开源社区再迎利器,腾讯混元图像 3.0 图生图模型在权威评测中跻身全球第一梯队,也是其中唯一的开源模型。

1 月 28 日,腾讯混元团队宣布开源混元图像 3.0 图生图版本(HunyuanImage 3.0-Instruct)。同时,最新全球权威大模型竞技场 LMArena 的图像编辑(Image Edit)榜单中,混元图像 3.0 图生图进入第一梯队,成为全球最强的开源图生图模型。

此前 1 月 26 日,该模型在元宝上线,用户只需要上传 1 张或以上的图片并输入指令即可体验。该能力受到众多用户喜爱,涌现了各种有意思的玩法。比如给猫猫拍大片、爆改世界名画等'花式整活'。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

网友在元宝上用混元图生图能力花式整活,图片来自网络

在最新的 LMArena 图片编辑榜单上,腾讯混元图像 3.0 图生图位列全球第七,也是前七名里面唯一开源的模型。LMArena 官方 X 祝贺混元图像 3.0 图生图'在图片编辑榜单中与 Nano-Banana 和 Seedream-4.5 等表现相当'。这一成绩来自于对模型图像编辑能力的全面盲测评估,包括指令遵循、编辑精确度和输出质量等多个维度。

在这里插入图片描述

混元图像 3.0 图生图支持多样化的图片编辑与多图融合能力,包括增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑功能,以及将多张照片中的元素提取出来合成新图片的能力。对于普通用户,该模型可用于制作表情包、虚拟人物合拍、社交分享等日常场景。对于专业用户,它能够助力电商海报设计、游戏角色定制、创意图片制作等专业领域,显著提升创作效率。

混元图像 3.0 图生图版本基于混元图像 3.0 的原生多模态架构构建,将文本理解、视觉理解与图像生成深度融合于同一模型中。作为原生多模态模型,混元图像 3.0 图生图核心创新在于其'先思考,后编辑'的工作流程。当接收到用户输入的图片和提示词后,模型会首先理解图像内容,然后基于提示词进行推理,确定需要编辑的区域、详细步骤以及需要保留的区域,最终形成更加详细的编辑指令。

混元图像 3.0 图生图基于 80B 总参数规模(激活参数约 13B)的混合专家原生多模态架构,在处理图像编辑任务时展现出强大的推理能力和精准的编辑效果。训练过程中,混元团队构建了千万量级的图生图数据,覆盖 80 多个任务,并注入了思维链数据,使模型能够学会先分析用户图像和意图,再输出详细编辑指令。后训练阶段采用自研 MixGRPO 算法,高效对齐用户偏好,大幅提升了指令响应和非编辑区域保持一致的效果。

2025 年 9 月,混元图像 3.0 文生图模型开源后,在 LMArena 全球文生图盲测榜单中位列第一。本次混元图像 3.0 图生图版本的开源是腾讯混元大模型系列的最新进展。开发者可通过 Github 和 Hugging Face 等主流开源平台获取混元图像 3.0 图生图模型的权重及完整代码。混元图像 3.0 图生图版本的开源,将为全球开发者和研究者提供一个强大的基础平台,助力社区在其基础上进行应用研发和二次开发。

腾讯混元团队一直在持续迭代通用基础能力和专业应用能力,研发了多种尺寸语言模型,以及图像、视频、3D 等完整多模态生成模型和工具集插件。目前混元系列大模型已在腾讯内部多个业务、外部多个行业和开源社区中被广泛接入。截止目前,腾讯混元的图像、视频衍生模型数量总数达到 3000 个,视频模型社区下载量超过 500 万,混元 3D 系列模型社区下载量超过 300 万,已成为全球最受欢迎的开源模型系列之一。

附混元图像 3.0 图生图开源项目地址:

  • Github:https://github.com/Tencent-Hunyuan/HunyuanImage-3.0
  • Hugging Face:https://huggingface.co/tencent/HunyuanImage-3.0-Instruct
  • Hugging Face(蒸馏版):https://huggingface.co/tencent/HunyuanImage-3.0-Instruct-Distil

目录

  1. 腾讯混元图像 3.0 图生图模型开源,LMArena 评测跻身全球第一梯队
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Home Assistant 插件下载加速:HACS 极速版部署与配置
  • 最新 ACM Fellow 名单发布,4 名中国大陆学者当选,中国机构入选人数第二
  • SpringBoot 结合 Redis+Caffeine 多级缓存架构实践
  • LogicGame:清华智谱发布大模型规则推理新基准
  • Apache SeaTunnel Web 从零搭建可视化数据集成平台
  • RMBG-2.0 企业级集成:API 封装、Flask 后端与前端拖拽上传方案
  • 算法实战:Z 字形变换与外观数列详解
  • Java 智能仿真无人机项目:任务处理与多线程协作
  • 修改 WSL2 网络模式为 Mirrored 以使用 Windows 代理
  • Dify 开源版源代码本地部署指南
  • LazyLLM 多 Agent 应用全流程实践:源码部署与可视化调试
  • 多模态 Agent 图像识别 Skills 开发实战:Web 全栈图像处理方案
  • 黑客概念内涵的演变与渗透测试基础指南
  • N_m3u8DL-RE 命令行工具:VR 视频下载实战指南
  • 基于 DeepSeek 和 Cursor 构建智能代码审查工具实战
  • Qwen3+Qwen Agent 智能体开发实战:接入 MCP 工具
  • 前端骨架屏实现详解:Vue、React、Angular、jQuery 及小程序实践
  • C++ STL set 系列:底层原理、核心接口与实战场景
  • 无人机多模态目标检测:高多样性基准数据集与融合方法
  • 前端监控实战:别让生产问题等到用户反馈

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online