全球顶级AI大模型最新排名出炉!Gemini 3.1 Pro与GPT-5.4智能并列第一,中国 GLM-5强势杀入前 5,DeepSeek V3.2 成性价比之王!

全球顶级AI大模型最新排名出炉!Gemini 3.1 Pro与GPT-5.4智能并列第一,中国 GLM-5强势杀入前 5,DeepSeek V3.2 成性价比之王!

你好,我是杰哥

刚刚,权威 AI 评测平台Artificial Analysis 发布了全球最新大模型三维排名:智能指数(Intelligence)、**输出速度(Output Tokens per Second)**和 价格(USD per 1M Tokens)

这次排名亮点满满:

  • 中美模型继续霸榜智能顶端,Gemini 3.1 Pro Preview 和 GPT-5.4(xhigh)并列57分第一
  • 中国模型表现亮眼GLM-5 智能第5(50分),DeepSeek V3.2虽然智能中等,但价格+速度综合性价比极高,继续展现“中国力量”!
GLM-5 是由中国领先的 AI 公司智谱AI(Zhipu AI)于 2026年2月11日(春节前夕)正式发布的新一代开源旗舰大模型,也被视为国产大模型在2026年开年的重磅作品。它在全球权威评测平台 Artificial AnalysisIntelligence Index 中获得 50分,位居全球第 5、开源模型第一,成为中国模型首次突破这一分数线的重要里程碑。
  • 速度王被 NVIDIA Nemotron 3 Super 夺走,价格最便宜的仍是开源/中国系模型。

下面我们一起具体来看。

一、智能指数(Intelligence)

核心能力排名,代表模型的综合推理、知识、创造力水平。

排行榜如下图(前10名):

  • Gemini 3.1 Pro Preview(Google):57分(并列第1)
  • GPT-5.4 (xhigh) (OpenAI):57分(并列第1)
  • Claude Opus 4.6 (max) (Anthropic):53分
  • Claude Sonnet 4.6 (max) (Anthropic):52分
  • GLM-5(智谱AI):50分 (中国模型第1,全球第5!)
  • Grok 4.20 Beta 0309(xAI):48分
  • Gemini 3 Flash(Google):46分
  • DeepSeek V3.2:42分
  • Nemotron 3 Super(NVIDIA):36分
  • gpt-oss-120B (high) :33分

杰哥点评
GeminiGPT-5.4 再次并驾齐驱,智能天花板被拉到新高度!中国 GLM-5 从上期榜单继续前进,稳居前 5,证明国产大模型在核心能力上已与国际顶级阵营并肩。DeepSeek V3.2 虽未进前 5,但作为开源/低成本代表,仍有不俗表现。Claude 双子星依然稳健,但已被中美模型拉开小差距。

二、输出速度(Speed)

每秒输出Token数,直接决定聊天、写作、代码生成的流畅度。

排行榜如下图(前10名):

  • NVIDIA Nemotron 3 Super:455 tokens/s(第1!)
  • gpt-oss-120B (high) :279 tokens/s(第2)
  • Grok 4.20 Beta 0309 :216 tokens/s
  • Gemini 3 Flash:166 tokens/s
  • Gemini 3.1 Pro Preview :125 tokens/s
  • GPT-5.4 (xhigh) :73 tokens/s
  • GLM-5:67 tokens/s
  • Claude Sonnet 4.6 (max) :55 tokens/s
  • Claude Opus 4.6 (max) :48 tokens/s
  • DeepSeek V3.2:28 tokens/s

杰哥点评
速度王彻底易主!NVIDIA Nemotron 3 Super455 tokens/s 碾压,成为“闪电侠”。Grok 4.20Gemini Flash 也进入前 4,日常使用体验极佳。GPT-5.4GLM-5 速度中等偏上,DeepSeek V3.2 速度偏慢,但胜在后面价格优势巨大——适合不追求极致速度的场景

三、价格(Price)

每百万Token美元价格(输入+输出综合参考),直接影响大规模使用成本。

排行榜如下图(从低到高):

  • gpt-oss-120B:0.3美元
  • DeepSeek V3.2:0.3美元(并列最便宜!)
  • Nemotron 3 Super:0.4美元
  • Gemini 3 Flash:1.1美元
  • GLM-5:1.6美元
  • Grok 4.20 Beta 0309:3美元
  • Gemini 3.1 Pro Preview:4.5美元
  • GPT-5.4 (xhigh) :5.6美元
  • Claude Sonnet 4.6 (max) :6美元
  • Claude Opus 4.6 (max) :10美元

杰哥点评
性价比之王诞生DeepSeek V3.2gpt-oss-120B 以 0.3美元/百万Token 并列最低,NVIDIA Nemotron 仅 0.4 美元——这三款几乎是“白菜价”。而顶级智能模型(Gemini/GPT-5.4/Claude Opus)价格明显更高,适合需要极致能力的场景。中国模型再次在成本控制上领先全球

总结:怎么选才是最优解?

  • 追求最强智能(写作、推理、复杂任务):Gemini 3.1 Pro PreviewGPT-5.4(57分天花板)
  • 追求极致速度(实时聊天、代码生成):NVIDIA Nemotron 3 Super(455 tokens/s)
  • 追求性价比(日常高频使用、创业/企业):DeepSeek V3.2gpt-oss-120B(0.3美元+可用速度)
  • 中国用户优选:GLM-5(智能前5+价格合理)、DeepSeek V3.2(最便宜)

AI时代,没有绝对最强,只有最适合。根据你的使用场景(智能/速度/预算)灵活选择,就能事半功倍!

你最看好哪款模型?是在用 GeminiGPT 还是国产 DeepSeek/GLM?欢迎评论区告诉我~

关注【AI信息风向】后,回复 666,即可获取更多 AI 行业报告。

AI 技术正以前所未有的速度发展,它将如何塑造我们的未来?让我们拭目以待。

Read more

RexUniNLU零样本NLU保姆级教程:WebUI上传文件+批量NER结果可视化

RexUniNLU零样本NLU保姆级教程:WebUI上传文件+批量NER结果可视化 1. 引言:为什么选择RexUniNLU? 如果你正在寻找一个不需要训练数据就能直接使用的自然语言理解工具,RexUniNLU可能就是你的理想选择。这个基于DeBERTa模型的零样本理解框架,最大的特点就是"开箱即用"——不需要准备任何标注数据,只需要定义好你想要抽取的内容结构,它就能自动从文本中识别出相应的信息。 想象一下这样的场景:你手头有大量文档需要提取人名、地名、组织机构名,但既没有时间也没有资源去标注训练数据。传统方法可能需要几周时间准备数据、训练模型,而RexUniNLU只需要几分钟就能开始工作。这就是零样本学习的魅力所在。 本文将手把手教你如何使用RexUniNLU的Web界面,通过上传文件的方式批量处理文本,并直观地可视化命名实体识别(NER)结果。无论你是技术小白还是有经验的开发者,都能快速上手。 2. 环境准备与快速启动 2.1 一键启动Web界面 使用RexUniNLU非常简单,只需要一条命令就能启动Web界面: python3 /root/nlp_debert

前端知识点梳理,前端面试复习

一:从输入 URL 到页面渲染是一个经典的综合性考题 1.URL 的标准组成部分 一个完整的 URL 结构如下: scheme://host:port/path?query#fragment URI 用字符串标识某一互联网资源,而URL 表示资源的地点(互 联网上所处的位置)。可见URL是URI 的子集。 URI 和 URL 的区别? * URI (Uniform Resource Identifier) 是统一资源标识符,是一个大概念。 * URL (Uniform Resource Locator) 是统一资源定位符,它不仅标识资源,还提供了找到资源的方式(比如协议)。可以理解为 URL 是 URI 的子集。 为什么 URL 中有些字符会被转义(

海景美女图FLUX.1镜像免配置:内置中文界面切换功能,支持中英双语Web UI

海景美女图FLUX.1镜像免配置:内置中文界面切换功能,支持中英双语Web UI 1. 开篇:告别复杂配置,开启AI绘画之旅 想象一下,你一直想尝试用AI生成图片,但面对复杂的安装步骤、全英文的界面和一堆看不懂的参数,是不是瞬间就打了退堂鼓?别担心,今天要介绍的这个工具,就是为你准备的。 “海景美女图 - 一丹一世界FLUX.1 AI 图像生成服务”是一个开箱即用的AI绘画工具。它的核心价值就两个字:简单。你不需要懂代码,不需要配置环境,甚至不需要懂太多英文。它已经为你准备好了一切,内置了中文界面,你只需要打开网页,输入几个词,点击一下,就能看到AI为你创作的、以海景美女为主题的图片。 这篇文章,我会带你从零开始,手把手教你如何使用这个工具。你会发现,原来让AI帮你画画,可以像点外卖一样简单。 2. 核心亮点:为什么选择这个镜像? 在众多AI绘画工具中,这个FLUX.1镜像有什么特别之处?它主要解决了三个痛点: 2.

AI+playwright+robotframework实现AI大模型驱动的web UI自动化测试

文章目录 * 前言 * 一、playwright与selenium 对比 * 二、AI-playwright MCP * 三、Playwright封装设计建议 * robotframerwork-browser 介绍 前言 前些日子将团队内的UI自动化完成了重构,由之前使用的selenium的迁移到了新生的工具playwright。 在AI大模型的加持下,脚本质量稳定和编写效率上得到了明显提升。刚刚发了一个关于AI 编写自动化接口测试的博客,看起来反响不错,所以又写了这篇文章与大家分享。本文从playwright与selenium 对比出发,尽量用简单语言来描述,一篇文章不太可能教会你如何去写,更多的是思路与设计的分享 一、playwright与selenium 对比 关于对比,之前有博主总结的蛮好,直接引用了 Playwright 与Selenium对比。我稍微总结一下,便于理解,从原理上对比 * selenium 使用“代理”webdriver 协议来统一接口对接不同厂家的浏览器 * playwright直接和各个浏览器原生底层调试协议来通信,