核心要点
- 突破性成就:腾讯混元 MT-7B 在 WMT25 全球翻译竞赛中获得 30/31 项第一名
- 双模型架构:Hunyuan-MT-7B 基础翻译模型 + Hunyuan-MT-Chimera-7B 集成优化模型
- 广泛语言支持:支持 33 种语言互译,包括 5 种中国少数民族语言
- 完全开源:2025 年 9 月 1 日正式开源,提供多种量化版本
- 实用部署:支持多种推理框架,提供详细的部署和使用指南
什么是腾讯混元翻译模型
腾讯混元翻译模型(Hunyuan-MT)是腾讯在 2025 年 9 月 1 日开源的专业翻译 AI 模型,由两个核心组件构成:
- Hunyuan-MT-7B:7B 参数的基础翻译模型,专注于将源语言文本准确翻译为目标语言
- Hunyuan-MT-Chimera-7B:业界首个开源翻译集成模型,通过融合多个翻译结果产生更高质量的输出
重要成就
在 WMT25 全球机器翻译竞赛中,该模型在参与的 31 个语言类别中获得了 30 个第一名,击败了 Google、OpenAI 等国际巨头的翻译模型。
核心技术特点与优势
技术优势
| 特性 | Hunyuan-MT-7B | 传统翻译模型 | 优势说明 |
|---|---|---|---|
| 参数规模 | 7B | 通常>10B | 更轻量,部署成本低 |
| 语言支持 | 33 种语言 | 10-20 种 | 覆盖更广泛 |
| 少数民族语言 | 5 种中国方言 | 几乎没有 | 填补市场空白 |
| 开源程度 | 完全开源 | 多为闭源 | 可自由使用 |
| 集成能力 | 支持 ensemble | 单一模型 | 质量更高 |
训练框架创新
腾讯提出了完整的翻译模型训练框架:
预训练 Pretrain -> 跨语言预训练 CPT -> 监督微调 SFT -> 翻译强化学习 Translation RL -> 集成强化学习 Ensemble RL -> 最终模型
最佳实践
这一训练流程在同规模模型中达到了 SOTA(State-of-the-Art)性能水平。
双模型架构详解
Hunyuan-MT-7B:基础翻译引擎
核心功能:
- 直接进行源语言到目标语言的翻译
- 支持 33 种语言的双向翻译
- 在同规模模型中性能领先
技术规格:
- 参数量:7B
- 训练数据:1.3T tokens,覆盖 112 种语言和方言
- 推理参数:top_k=20, top_p=0.6, temperature=0.7, repetition_penalty=1.05
Hunyuan-MT-Chimera-7B:集成优化器
创新特点:

