权威 AI 评测平台 Artificial Analysis 发布了全球最新大模型三维排名:智能指数(Intelligence)、输出速度(Output Tokens per Second)和价格(USD per 1M Tokens)。

此次排名的核心亮点在于中美模型继续霸榜智能顶端,其中 Gemini 3.1 Pro Preview 和 GPT-5.4(xhigh)以 57 分并列第一。中国模型表现同样亮眼,GLM-5 在智能指数上位列第 5(50 分),DeepSeek V3.2 虽智能中等,但凭借价格和速度的综合优势,展现出极高的性价比。
GLM-5 是由智谱 AI 于 2026 年 2 月 11 日正式发布的新一代开源旗舰大模型,被视为国产大模型在 2026 年的重磅作品。它在 Artificial Analysis 的 Intelligence Index 中获得 50 分,位居全球第 5、开源模型第一,成为中国模型首次突破这一分数线的重要里程碑。
此外,速度王被 NVIDIA Nemotron 3 Super 夺走,而价格最便宜的仍是开源或中国系模型。
一、智能指数(Intelligence)
这是核心能力排名,代表模型的综合推理、知识、创造力水平。

- Gemini 3.1 Pro Preview(Google):57 分(并列第 1)
- GPT-5.4 (xhigh)(OpenAI):57 分(并列第 1)
- Claude Opus 4.6 (max)(Anthropic):53 分
- Claude Sonnet 4.6 (max)(Anthropic):52 分
- GLM-5(智谱 AI):50 分(中国模型第 1,全球第 5)
- Grok 4.20 Beta 0309(xAI):48 分
- Gemini 3 Flash(Google):46 分
- DeepSeek V3.2:42 分
- Nemotron 3 Super(NVIDIA):36 分
- gpt-oss-120B (high):33 分
分析: Gemini 和 GPT-5.4 再次并驾齐驱,智能天花板被拉到新高度。中国 GLM-5 稳居前 5,证明国产大模型在核心能力上已与国际顶级阵营并肩。DeepSeek V3.2 虽未进前 5,但作为开源/低成本代表,仍有不俗表现。Claude 双子星依然稳健,但已被中美模型拉开小差距。
二、输出速度(Speed)
每秒输出 Token 数,直接决定聊天、写作、代码生成的流畅度。

- NVIDIA Nemotron 3 Super:455 tokens/s(第 1)
- gpt-oss-120B (high):279 tokens/s(第 2)



