权威 AI 评测平台 Artificial Analysis 发布了全球最新大模型三维排名:智能指数(Intelligence)、输出速度(Output Tokens per Second)和价格(USD per 1M Tokens)。

这次排名亮点如下:
- 中美模型继续霸榜智能顶端,Gemini 3.1 Pro Preview 和 GPT-5.4(xhigh)并列 57 分第一!
- 中国模型表现亮眼:GLM-5 智能第 5(50 分),DeepSeek V3.2 虽然智能中等,但价格 + 速度综合性价比极高。
GLM-5 是由中国领先的 AI 公司智谱 AI(Zhipu AI)于 2026 年 2 月 11 日发布的新一代开源旗舰大模型。它在全球权威评测平台 Artificial Analysis 的 Intelligence Index 中获得 50 分,位居全球第 5、开源模型第一。
一、智能指数(Intelligence)
核心能力排名,代表模型的综合推理、知识、创造力水平。
排行榜如下图(前 10 名):

- Gemini 3.1 Pro Preview(Google):57 分(并列第 1)
- GPT-5.4 (xhigh) (OpenAI):57 分(并列第 1)
- Claude Opus 4.6 (max) (Anthropic):53 分
- Claude Sonnet 4.6 (max) (Anthropic):52 分
- GLM-5(智谱 AI):50 分(中国模型第 1,全球第 5)
- Grok 4.20 Beta 0309(xAI):48 分
- Gemini 3 Flash(Google):46 分
- DeepSeek V3.2:42 分
- Nemotron 3 Super(NVIDIA):36 分
- gpt-oss-120B (high) :33 分
Gemini 和 GPT-5.4 再次并驾齐驱,智能天花板被拉到新高度。中国 GLM-5 稳居前 5,证明国产大模型在核心能力上已与国际顶级阵营并肩。Claude 双子星依然稳健,但已被中美模型拉开小差距。
二、输出速度(Speed)
每秒输出 Token 数,直接决定聊天、写作、代码生成的流畅度。
排行榜如下图(前 10 名):

- NVIDIA Nemotron 3 Super:455 tokens/s(第 1)
- gpt-oss-120B (high) :279 tokens/s(第 2)
- Grok 4.20 Beta 0309 :216 tokens/s
- Gemini 3 Flash:166 tokens/s
- Gemini 3.1 Pro Preview :125 tokens/s
- GPT-5.4 (xhigh) :73 tokens/s
- GLM-5:67 tokens/s
- Claude Sonnet 4.6 (max) :55 tokens/s
- Claude Opus 4.6 (max) :48 tokens/s
- DeepSeek V3.2:28 tokens/s
速度王彻底易主!NVIDIA Nemotron 3 Super 以 455 tokens/s 碾压,成为'闪电侠'。Grok 4.20 和 Gemini Flash 也进入前 4,日常使用体验极佳。GPT-5.4 和 GLM-5 速度中等偏上,DeepSeek V3.2 速度偏慢,但胜在后面价格优势巨大——适合不追求极致速度的场景。
三、价格(Price)
每百万 Token 美元价格(输入 + 输出综合参考),直接影响大规模使用成本。
排行榜如下图(从低到高):

- gpt-oss-120B:0.3 美元
- DeepSeek V3.2:0.3 美元(并列最便宜)
- Nemotron 3 Super:0.4 美元
- Gemini 3 Flash:1.1 美元
- GLM-5:1.6 美元
- Grok 4.20 Beta 0309:3 美元
- Gemini 3.1 Pro Preview:4.5 美元
- GPT-5.4 (xhigh) :5.6 美元
- Claude Sonnet 4.6 (max) :6 美元
- Claude Opus 4.6 (max) :10 美元
性价比之王诞生!DeepSeek V3.2 和 gpt-oss-120B 以 0.3 美元/百万 Token 并列最低,NVIDIA Nemotron 仅 0.4 美元。而顶级智能模型(Gemini/GPT-5.4/Claude Opus)价格明显更高,适合需要极致能力的场景。中国模型再次在成本控制上领先全球。
总结:怎么选才是最优解?
- 追求最强智能(写作、推理、复杂任务):Gemini 3.1 Pro Preview 或 GPT-5.4(57 分天花板)
- 追求极致速度(实时聊天、代码生成):NVIDIA Nemotron 3 Super(455 tokens/s)
- 追求性价比(日常高频使用、创业/企业):DeepSeek V3.2 或 gpt-oss-120B(0.3 美元 + 可用速度)
- 中国用户优选:GLM-5(智能前 5+ 价格合理)、DeepSeek V3.2(最便宜)
AI 时代,没有绝对最强,只有最适合。根据你的使用场景(智能/速度/预算)灵活选择,就能事半功倍。


