核心要点
- 突破性成就:腾讯混元 MT-7B 在 WMT25 全球翻译竞赛中获得 30/31 项第一名
- 双模型架构:Hunyuan-MT-7B 基础翻译模型 + Hunyuan-MT-Chimera-7B 集成优化模型
- 广泛语言支持:支持 33 种语言互译,包括 5 种中国少数民族语言
- 完全开源:2025 年 9 月 1 日正式开源,提供多种量化版本
腾讯混元翻译模型(Hunyuan-MT)于 2025 年 9 月开源,包含 7B 参数基础模型及集成优化模型。在 WMT25 竞赛中获 30/31 项第一,支持 33 种语言互译,涵盖中国少数民族语言。提供多种量化版本及 vLLM、TensorRT-LLM 等部署方案,适用于企业级应用及开发者场景。
腾讯混元翻译模型(Hunyuan-MT)是腾讯在 2025 年 9 月 1 日开源的专业翻译 AI 模型,由两个核心组件构成:
重要成就
在 WMT25 全球机器翻译竞赛中,该模型在参与的 31 个语言类别中获得了 30 个第一名,击败了 Google、OpenAI 等国际巨头的翻译模型。
| 特性 | Hunyuan-MT-7B | 传统翻译模型 | 优势说明 |
|---|---|---|---|
| 参数规模 | 7B | 通常>10B | 更轻量,部署成本低 |
| 语言支持 | 33 种语言 | 10-20 种 | 覆盖更广泛 |
| 少数民族语言 | 5 种中国方言 | 几乎没有 | 填补市场空白 |
| 开源程度 | 完全开源 | 多为闭源 | 可自由使用 |
| 集成能力 | 支持 ensemble | 单一模型 | 质量更高 |
腾讯提出了完整的翻译模型训练框架:
预训练 Pretrain -> 跨语言预训练 CPT -> 监督微调 SFT -> 翻译强化学习 Translation RL -> 集成强化学习 Ensemble RL -> 最终模型
最佳实践
这一训练流程在同规模模型中达到了 SOTA(State-of-the-Art)性能水平。
核心功能:
技术规格:
创新特点:
工作原理:
输入:源文本 + 6 个候选翻译
处理:质量分析 + 融合优化
输出:单一最优翻译结果
| 语言类别 | 具体语言 | 语言代码 |
|---|---|---|
| 主要语言 | 中文、英语、法语、西班牙语、日语 | zh, en, fr, es, ja |
| 欧洲语言 | 德语、意大利语、俄语、波兰语、捷克语 | de, it, ru, pl, cs |
| 亚洲语言 | 韩语、泰语、越南语、印地语、阿拉伯语 | ko, th, vi, hi, ar |
| 中国方言 | 繁体中文、粤语、藏语、维吾尔语、蒙古语 | zh-Hant, yue, bo, ug, mn |
把下面的文本翻译成<target_language>,不要额外解释。 <source_text>
Translate the following segment into <target_language>, without additional explanation. <source_text>
Analyze the following multiple <target_language> translations of the <source_language> segment surrounded in triple backticks and generate a single refined <target_language> translation. Only output the refined translation, do not explain. The <source_language> segment: ```<source_text>``` The multiple <target_language> translations: 1. ```<translated_text1>``` 2. ```<translated_text2>``` 3. ```<translated_text3>``` 4. ```<translated_text4>``` 5. ```<translated_text5>``` 6. ```<translated_text6>```
历史性突破
在 WMT25 全球机器翻译竞赛中,Hunyuan-MT-7B 在 31 个参赛语言类别中获得 30 个第一名,仅有 1 个类别未获第一。
测试语言对包括:
根据 WMT25 竞赛结果显示,Hunyuan-MT 在多项评估指标上表现优异:
注意
具体性能数据因语言对和测试集而异,详细评估结果请参考 WMT25 官方报告和腾讯技术论文。
| 模型版本 | 描述 | 下载链接 |
|---|---|---|
| Hunyuan-MT-7B | 标准版本 | HuggingFace |
| Hunyuan-MT-7B-fp8 | FP8 量化版 | HuggingFace |
| Hunyuan-MT-Chimera-7B | 集成版本 | HuggingFace |
| Hunyuan-MT-Chimera-fp8 | 集成量化版 | HuggingFace |
from transformers import AutoModelForCausalLM, AutoTokenizer
# 加载模型
model_name = "tencent/Hunyuan-MT-7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto")
# 准备翻译请求
messages = [{"role":"user","content":"Translate the following segment into Chinese, without additional explanation.\n\nIt's on the house."}]
# 执行翻译
tokenized_chat = tokenizer.apply_chat_template(
messages, tokenize=True, add_generation_prompt=False, return_tensors="pt"
)
outputs = model.generate(tokenized_chat.to(model.device), max_new_tokens=2048)
result = tokenizer.decode(outputs[0])
python3 -m vllm.entrypoints.openai.api_server \
--host 0.0.0.0 \
--port 8000 \
--trust-remote-code \
--model tencent/Hunyuan-MT-7B \
--tensor-parallel-size 1 \
--dtype bfloat16
trtllm-serve /path/to/HunYuan-7b \
--host localhost \
--port 8000 \
--backend pytorch \
--max_batch_size 32 \
--tp_size 2
docker run --gpus all -p 30000:30000 \
lmsysorg/sglang:latest \
-m sglang.launch_server \
--model-path hunyuan/huanyuan_7B \
--tp 4 --trust-remote-code
腾讯内部产品集成:
| 应用领域 | 具体用例 | 推荐模型 |
|---|---|---|
| 内容本地化 | 网站、应用多语言版本 | Hunyuan-MT-7B |
| 实时通信 | 聊天应用翻译功能 | Hunyuan-MT-7B |
| 文档翻译 | 技术文档、合同翻译 | Hunyuan-MT-Chimera-7B |
| 教育培训 | 多语言学习材料 | Hunyuan-MT-Chimera-7B |
独特价值 少数民族语言支持:填补市场空白,支持藏语、维吾尔语等 轻量化部署:7B 参数相比大型模型部署成本更低 集成优化:Chimera 模型提供更高质量的翻译结果
A: 主要优势包括:
A: 推荐配置:
A: 选择建议:
A: 是的,模型支持进一步微调:
A: 根据开源发布信息:

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online