GTC2026 前瞻:Agentic AI 开源模型与 Physical AI 机器人趋势
如果说过去两年的大模型竞赛核心是'谁能生成更像人的答案',那么到了 GTC 2026,焦点已经明显转移。英伟达将 Agentic AI 列为大会四大核心主题之一,定义也更为务实:重点不再是单轮问答,而是让 AI Agent 能够推理、规划、检索并执行动作,最终把企业数据转化为可投入生产的'数字劳动力'。这意味着 Agentic AI 已从一个前沿概念,转变为下一阶段 AI 商业化的主战场。
Agentic AI:从'会回答'到'会做事'
官方对 Agentic AI 的理解非常工程化。它强调的是高性能 Agent 架构,要求系统能在实时环境中动态规划、调用工具、跨数据源检索,并在 GPU 上规模化运行。这标志着 AI 的价值衡量标准正在改变——企业不再只关心模型会不会写总结,更关心它能否持续完成任务、可靠调用工具、处理复杂流程,并在成本可控的前提下进入生产环境。
开源模型在 Agentic AI 时代的回归
黄仁勋在 GTC 安排了题为 'Open Models: Where We Are and Where We're Headed' 的重点讨论,释放出一个关键信号:在 Agentic AI 时代,企业更需要的是可定制、可部署、可审计、可复现的模型体系,而不仅仅是'最强闭源 API'。一旦模型开始连接企业知识库、内部工作流和外部工具,数据主权、系统可控性与成本透明度,就会和能力本身一样重要。
在此背景下,NVIDIA Nemotron 3 Super 几乎成了最清晰的产品信号。这是一个 120B 总参数、12B 激活参数的混合式 MoE 模型,采用 Hybrid Mamba-Transformer 设计,支持 最长 100 万 token 上下文。官方数据显示,在 8k 输入、16k 输出的测试设置下,其推理吞吐可达到 GPT-OSS-120B 的 2.2 倍、Qwen3.5-122B 的 7.5 倍,同时在多项基准上保持高准确率。英伟达显然想说明:Agentic AI 需要的不是'最大模型',而是在长上下文、多步骤推理和高吞吐部署之间取得平衡的模型。
Nemotron 3 Super 的设计逻辑非常鲜明:它不是为了在单一对话 benchmark 上刷分,而是为了在 Agent 系统里承担'高层规划与复杂推理'的角色。Mamba 层提升内存与计算效率,MoE 让推理时只激活部分参数,Latent MoE 带来多专家收益,Multi-Token Prediction 则进一步提升生成速度。官方表示,它在 Blackwell 上使用 NVFP4 精度运行时,推理速度可比 Hopper 上的 FP8 快到 4 倍,同时不损失准确率。这一定位很明确:它是一个为复杂 Agent 编排、长链路任务和高频推理优化过的中枢模型。
值得注意的是,这次'开源'不只是在放权重,而是在开放整条生产线。NVIDIA 官方给出的信息是,这次开放的不只是权重,还包括训练数据、后训练数据、强化学习环境、技术报告、评测方法和部署 Cookbook。预训练与后训练管线覆盖了 10 万亿级别的精选 token、数千万条后训练样本,以及多种交互式强化学习环境。换句话说,这一轮开源的重点,不只是让你'下载一个模型',而是让你能够复现、微调、替换、再训练,并把它真正接入自己的企业环境。
落地靠的不是模型,而是完整工作流
Agentic AI 真正落地,靠的从来不只是模型,而是'模型 + 工作流 + 检索 + 观测 + 评估'。这正是 AI-Q Blueprint 和 NeMo Agent Toolkit 出场的原因。
AI-Q 的目标是把 AI Agent 连接到企业数据,用推理和工具去蒸馏复杂资料,并生成高质量研究结果。官方给出的指标包括 生成速度提升 5 倍、大规模企业数据摄取速度提升 15 倍、检索延迟降低 3 倍。配套的 Enterprise Reference Architecture 文档进一步说明,AI-Q Research Agent 可以同时利用内部与外部数据源,在需要时进行网络搜索,并生成详细报告;其底层控制层是 NeMo Agent Toolkit,可与 LangChain、LlamaIndex 等框架集成。
NeMo Agent Toolkit 被定义为一个轻量、统一、框架无关的 Agent 开发库,能够把已有 Agent、工具和数据源连接起来,并提供 profiling、observability 和 evaluation 能力。它并不要求开发者完全迁移到某一种 Agent 框架,而是可以和 LangChain、LlamaIndex、CrewAI 甚至自定义 Python Agent 并行工作,同时支持对工作流的 Token、时延、组件输入输出进行观察和调试。对企业来说,这比'再出一个模型'更重要,因为 Agentic AI 最大的难题往往不是模型不会回答,而是。


