AI 深度观察：GTC 开幕、Agent 工程化与具身智能新进展

今天是 NVIDIA GTC 2026 的开幕日，也是本周 AI 圈最密集的一个爆发点。三件事同时发生：NVIDIA 用 NemoClaw 宣示进入 Agent 基础设施赛道；微软开源 AgentRx，把 AI Agent 的调试工程化带上台面；与此同时，来自中国的大晓机器人悄悄开源了一个端侧运行的具身世界模型，推理速度比前代快 72 倍。AI Coding 走向'平台化'，具身智能走向'可部署'——变化正在加速。

NVIDIA GTC 2026 开幕：NemoClaw 登场，Physical AI 成为主轴

NVIDIA GTC 2026 开幕，Physical AI 成为大会核心主题

NVIDIA GTC 2026 今日在美国加州圣何塞正式开幕（3 月 15–19 日），CEO 黄仁勋主题演讲定于明日。大会已确认三大主线：开源企业 Agent 平台 NemoClaw（硬件无关，内置安全层，已与 Salesforce、Cisco、Google 等洽谈合作）；下一代 Rubin Ultra GPU 及 Feynman 架构前瞻（推理成本预计降至 Blackwell 的 1/10）；以及 Physical AI 独立专题，汇聚 SkildAI、PhysicsX、Waabi 等机器人基础模型团队，聚焦仿真→真实部署的关键卡点。

NemoClaw 的意义不只是一款新产品，它代表着 NVIDIA 战略重心的一次跃迁——从'卖最好的算力'转向'控制 AI Agent 的基础设施层'。硬件无关的开源策略，是在用开放性换生态，直接对标 Anthropic 的 Claude Code 和 OpenAI 的 Codex 生态。而 Physical AI 首次作为独立主轴出现在 GTC，标志着行业共识已经形成：具身智能的技术路径不是'等待更强的模型'，而是仿真、数字孪生与基础模型的工程化整合，这个收敛点正在 GTC 这个舞台上被定义。

微软开源 AgentRx：AI Agent 的'系统性调试处方'

微软研究院发布 AgentRx，解决 AI Agent 调试黑盒难题

微软研究院今日宣布开源 AgentRx——一个自动化、跨领域的 AI Agent 失败诊断框架。核心能力包括精准定位 Agent 执行轨迹中的'关键失败步骤'，通过约束合成 + 守卫评估 + LLM 裁决三阶段管道，输出可审计的违规证据日志，并按 9 类故障分类法归因（计划偏离、工具调用无效、编造信息等）。附带 115 条手工标注失败轨迹的 AgentRx Benchmark，适用于 API 工作流、Web 操作、事件管理等多类场景。

当前 AI Coding Agent 的最大工程痛点之一，是'它坏了但你不知道哪里坏了'——Agent 轨迹长、随机性高、多步骤级联，传统调试工具完全失效。AgentRx 把 Agent 调试从'玄学提示工程'变成了'可追溯的工程实践'，直接对标软件工程中的可观测性（Observability）体系。更深的意义在于：它的开源为整个 AI Agent 生态建立了一套故障分类法和评估标准，这往往是技术走向成熟的前兆——先有标准，再有产业。

Anthropic 披露：Claude 已自主完成 70–90% 的模型开发代码

Anthropic 披露 Claude 自我编写代码的比例已达 70%-90%

Anthropic 内部披露，目前其模型开发过程中，，并预测完全自动化的 AI 研究可能在一年内实现。同期，小米 CyberOne 人形机器人已部署于汽车生产线，执行螺母上件、料箱搬运等任务，核心操作准确率达；Figure 发布 Helix 02，单一神经控制系统统一驱动移动与操作，响应时间缩短 60%，已无干预完成客厅清洁任务。

AI 深度观察：GTC 开幕、Agent 工程化与具身智能新进展