1、前言
2026 年 3 月第三周(3/17–3/23),可能是今年 AI 行业信息密度最高的一周。
NVIDIA GTC 大会抛出万亿美元级硬件路线图;OpenAI 收购 Python 核心工具链;Anthropic 把 Claude Code 接入 Telegram 和 Discord;小米一个"匿名模型"搞得全球开发者以为是 DeepSeek V4;Cursor 被曝底层跑的是 Kimi K2.5——十余条重磅新闻接连引爆。
一个清晰的信号浮出水面:AI 正在从"聊天工具"全面切换到"自主 Agent"。
本文是我对这一周所有重要事件的梳理与解读,既有新闻事实,也有我的个人分析。不废话,直接开始。
2、一周大事件时间线
先上一张总览图,方便大家快速定位本周发生了什么:
信息量很大,下面逐个展开。
3、NVIDIA GTC 2026:万亿美元的 AI 硬件帝国
3.1、Vera Rubin 平台发布
3 月 16 日,GTC 2026 在圣何塞开幕,Jensen Huang 的主题演讲再次刷新了行业对 AI 基础设施规模的认知。
Vera Rubin 是 Blackwell 之后的下一代 AI 计算平台,核心是NVL72 机架——一个 5 机架、7 芯片的集成系统,内含 72 颗 Rubin GPU、36 颗 Vera CPU(ARM 架构)和超过 130 万个组件,通过 NVLink 6 高速互联。完整的 Vera Rubin POD 由 40 个这样的机架组成,共 1152 颗 GPU,总算力达 60 exaFLOPS。
关键性能指标:
- 训练性能较 Blackwell 提升4 倍
- 每瓦推理性能提升10 倍
- 预计 2026 年下半年通过 Azure 和 Google Cloud 交付
Jensen Huang 同时把 Blackwell + Vera Rubin 的合计采购订单预期从 5000 亿美元翻倍至1 万亿美元。
3.2、Groq 3 LPU:专用推理芯片首秀
另一个重头戏是Groq 3 LPU——NVIDIA 在 2025 年圣诞夜以 200 亿美元收购 Groq 后的首款芯片。这是一颗基于 SRAM 的推理加速器:
- 每颗芯片 512MB 片上 SRAM
- 内存带宽 150 TB/s
- 三星 4nm 工艺
- LPX 机架可容纳 256 颗 LPU
核心卖点:与 NVL72 配合使用时,每兆瓦推理吞吐量提升 35 倍。这是 NVIDIA 首次在其平台中加入专用推理硬件,信号很明确——推理(inference)已经和训练(training)一样重要了。
3.3、软件生态:NemoClaw、Nemotron 联盟
硬件之外,NVIDIA 的软件生态布局同样值得关注:
NemoClaw:面向企业的 OpenClaw 安全部署栈。Jensen Huang 在演讲中称 OpenClaw 为"个人 AI 的操作系统",NemoClaw 就是让企业能安全地大规模部署它。
Nemotron Coalition:由 Mistral AI、Perplexity、Cursor、LangChain、Black Forest Labs 等参与的开放模型联盟,将在 DGX Cloud 上共同开发开源前沿模型。
Nemotron 3 Super:1200 亿参数、120 亿活跃的混合 Mamba-Transformer MoE 模型,在 SWE-Bench Verified 上拿到 60.47%——开源模型第一。
我的看法:NVIDIA 的战略已经从"卖 GPU"进化为"卖 AI 全栈平台"。Groq 3 LPU 的加入意味着它不再只做训练硬件——Agent 时代推理需求爆炸,NVIDIA 在补这块拼图。Nemotron Coalition 更是直接把生态伙伴绑在了 DGX Cloud 上,软硬件闭环越来越紧。


