MiniMax-M2.1 开源发布
MiniMax-M2.1 现已正式开源交付。此次发布旨在打破高性能智能体必须闭门造车的刻板印象,专门优化了模型在编码、工具使用、指令遵循和长远规划方面的稳健性。支持自动化多语言软件开发及复杂多步骤办公流程,构建新一代自主应用程序。

使用方法
- MiniMax-M2.1 API 已在开放平台上线:https://platform.minimax.io/docs/guides/text-generation
- 基于 MiniMax-M2.1 构建的产品 MiniMax Agent 已公开可用:https://agent.minimax.io/
- 模型权重已开源,支持本地部署:https://huggingface.co/MiniMaxAI/MiniMax-M2.1
基准测试
MiniMax-M2.1 在核心软件工程排行榜上相较 M2 实现了显著提升。它在多语言场景中表现尤为突出,超越了 Claude Sonnet 4.5,并接近 Claude Opus 4.5 的水平。
| Benchmark | MiniMax-M2.1 | MiniMax-M2 | Claude Sonnet 4.5 | Claude Opus 4.5 | Gemini 3 Pro | GPT-5.2 (thinking) | DeepSeek V3.2 |
|---|---|---|---|---|---|---|---|
| SWE-bench Verified | 74.0 | 69.4 | 77.2 | 80.9 | 78.0 | 80.0 | 73.1 |
| Multi-SWE-bench | 49.4 | 36.2 | 44.3 | 50.0 | 42.7 | x | 37.4 |
| SWE-bench Multilingual | 72.5 | 56.5 | 68 | 77.5 | 65.0 | 72.0 | 70.2 |
| Terminal-bench 2.0 | 47.9 | 30.0 | 50.0 | 57.8 | 54.2 | 54.0 | 46.4 |
我们还在多种编码代理框架上对 MiniMax-M2.1 进行了 SWE-bench Verified 评估。结果表明该模型具有卓越的框架泛化能力和强大的稳定性。
此外,在包括测试用例生成、代码性能优化、代码审查和指令遵循等具体基准测试中,MiniMax-M2.1 相较 M2 展现出全面提升。在这些专业领域,其表现持续达到或超越 Claude Sonnet 4.5 的水平。
| Benchmark |
|---|


