AI 深度观察:GTC 开幕、Agent 工程化与具身智能新进展
今天是 NVIDIA GTC 2026 的开幕日,也是本周 AI 圈最密集的一个爆发点。三件事同时发生:NVIDIA 用 NemoClaw 宣示进入 Agent 基础设施赛道;微软开源 AgentRx,把 AI Agent 的调试工程化带上台面;与此同时,来自中国的大晓机器人悄悄开源了一个端侧运行的具身世界模型,推理速度比前代快 72 倍。AI Coding 走向'平台化',具身智能走向'可部署'——变化正在加速。
NVIDIA GTC 2026 开幕:NemoClaw 登场,Physical AI 成为主轴

NVIDIA GTC 2026 今日在美国加州圣何塞正式开幕(3 月 15–19 日),CEO 黄仁勋主题演讲定于明日。大会已确认三大主线:开源企业 Agent 平台 NemoClaw(硬件无关,内置安全层,已与 Salesforce、Cisco、Google 等洽谈合作);下一代 Rubin Ultra GPU 及 Feynman 架构前瞻(推理成本预计降至 Blackwell 的 1/10);以及 Physical AI 独立专题,汇聚 SkildAI、PhysicsX、Waabi 等机器人基础模型团队,聚焦仿真→真实部署的关键卡点。
NemoClaw 的意义不只是一款新产品,它代表着 NVIDIA 战略重心的一次跃迁——从'卖最好的算力'转向'控制 AI Agent 的基础设施层'。硬件无关的开源策略,是在用开放性换生态,直接对标 Anthropic 的 Claude Code 和 OpenAI 的 Codex 生态。而 Physical AI 首次作为独立主轴出现在 GTC,标志着行业共识已经形成:具身智能的技术路径不是'等待更强的模型',而是仿真、数字孪生与基础模型的工程化整合,这个收敛点正在 GTC 这个舞台上被定义。
微软开源 AgentRx:AI Agent 的'系统性调试处方'

微软研究院今日宣布开源 AgentRx——一个自动化、跨领域的 AI Agent 失败诊断框架。核心能力包括精准定位 Agent 执行轨迹中的'关键失败步骤',通过约束合成 + 守卫评估 + LLM 裁决三阶段管道,输出可审计的违规证据日志,并按 9 类故障分类法归因(计划偏离、工具调用无效、编造信息等)。附带 115 条手工标注失败轨迹的 AgentRx Benchmark,适用于 API 工作流、Web 操作、事件管理等多类场景。
当前 AI Coding Agent 的最大工程痛点之一,是'它坏了但你不知道哪里坏了'——Agent 轨迹长、随机性高、多步骤级联,传统调试工具完全失效。AgentRx 把 Agent 调试从'玄学提示工程'变成了'可追溯的工程实践',直接对标软件工程中的可观测性(Observability)体系。更深的意义在于:它的开源为整个 AI Agent 生态建立了一套故障分类法和评估标准,这往往是技术走向成熟的前兆——先有标准,再有产业。
Anthropic 披露:Claude 已自主完成 70–90% 的模型开发代码

Anthropic 内部披露,目前其模型开发过程中,70%–90% 的代码已由 Claude 自身完成,并预测完全自动化的 AI 研究可能在一年内实现。同期,小米 CyberOne 人形机器人已部署于汽车生产线,执行螺母上件、料箱搬运等任务,核心操作准确率达 ;Figure 发布 Helix 02,单一神经控制系统统一驱动移动与操作,响应时间缩短 60%,已无干预完成客厅清洁任务。




