权威 AI 评测平台发布最新三维排名
近期,权威 AI 评测平台 Artificial Analysis 发布了全球最新大模型三维排名:智能指数(Intelligence)、**输出速度(Output Tokens per Second)**和 价格(USD per 1M Tokens)。

本次排名的核心亮点在于中美模型的持续领跑以及国产模型的显著进步。Gemini 3.1 Pro Preview 和 GPT-5.4(xhigh)在智能指数上并列第一,而中国模型 GLM-5 和 DeepSeek V3.2 分别在综合能力和性价比上表现突出。
一、智能指数(Intelligence)
该指标代表模型的综合推理、知识储备及创造力水平。以下是前 10 名榜单:

- Gemini 3.1 Pro Preview(Google):57 分(并列第 1)
- GPT-5.4 (xhigh) (OpenAI):57 分(并列第 1)
- Claude Opus 4.6 (max) (Anthropic):53 分
- Claude Sonnet 4.6 (max) (Anthropic):52 分
- GLM-5(智谱 AI):50 分(中国模型第 1,全球第 5)
- Grok 4.20 Beta 0309(xAI):48 分
- Gemini 3 Flash(Google):46 分
- DeepSeek V3.2:42 分
- Nemotron 3 Super(NVIDIA):36 分
- gpt-oss-120B (high) :33 分
分析:Gemini 和 GPT-5.4 再次并驾齐驱,将智能天花板拉至新高度。中国模型 GLM-5 稳居前 5,证明国产大模型在核心能力上已与国际顶级阵营并肩。DeepSeek V3.2 虽未进前 5,但作为开源/低成本代表仍有不俗表现。
二、输出速度(Speed)
每秒输出 Token 数直接决定聊天、写作及代码生成的流畅度。

- NVIDIA Nemotron 3 Super:455 tokens/s(第 1)
- gpt-oss-120B (high) :279 tokens/s(第 2)
- Grok 4.20 Beta 0309 :216 tokens/s
- Gemini 3 Flash:166 tokens/s
- Gemini 3.1 Pro Preview :125 tokens/s



