十篇 AI Agent 研报,看懂 2025 年全球智能体行业全景
差不多每个春节前后,科技界都会有些'大事件'发生,尤其是这几年日新月异的 AI 领域。
往年都是国外产品吸引眼球,而今年换成了中国技术惊艳全球。
春节前幻方量化发布的大模型 DeepSeek-R1,一经亮相便迅速炸场 AI 领域,全球的企业管理者、创业者、项目经理、分析师乃至相关部门领导人都现身说法,感慨 DeepSeek-R1 在大模型领域取得的突破性进展。
DeepSeek-R1 在后训练阶段采用了大规模强化学习技术,使得在标注数据极少的情况下,依然能实现显著提升推理能力。这一技术的进步使它在数学、代码及自然语言推理等多项任务中,表现出可与 OpenAI 的最新版本相媲美的性能,真正实现了开源化。这意味着,AI 领域正在朝着'低成本 + 高性能'方向迈进。
重要的是,基于 DeepSeek-R1 的 browser-use 等很多智能体实操案例已经证明,DeepSeek 能够有效降低部署 AI Agent 的门槛,能够大幅提升 AI Agent 性能和效率,增强场景适应能力。
在 LLM Based AI Agent 亟待落地的当下,一个高效且性价比可观的大模型对于智能体的重要性可想而知。可以预见,接下来 DeepSeek-R1 等强化学习类大模型,将会极大地提升智能体的构建与应用效率,进一步加速 AI Agent 的落地应用。
当然,在智能体成为 AI 应用主旋律的当下,春节前后更精彩的仍然是 AI Agent 行业,产品研发与生态扩建方面全球技术厂商都在马不停蹄。
谷歌于 2024 年 12 月发布了全新多模态大模型 Gemini 2.0,其性能全面提升,支持图片、视频和音频等多模态输入与输出。基于 Gemini 2.0 架构,谷歌推出了三个新的 AI 智能体原型:通用大模型助手 Project Astra、浏览器助手 Project Mariner 和编程助手 Jules。其中,编程助手 Jules 能够直接集成到 GitHub 的工作流程系统中,分析复杂代码库并实施修复。
微软于 2024 年 10 月宣布在 Dynamics 365 中集成 10 个自主 AI Agent,这些智能体能够自动执行客服、销售、财务、仓储等业务流程。这些 AI Agent 支持 OpenAI 的 o1 模型,具备自主学习能力,可以自动执行跨平台的超复杂业务。例如,美国著名电信公司 Lumen 通过 AI Agent 每年能节省 5000 万美元成本,相当于增加了 187 名全职劳动力。
OpenAI 在 2025 年 1 月 24 日发布了其首款 AI Agent——Operator,该系统能够自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。2 月 2 日正式推出面向深度研究领域的智能体产品深度研究(Deep research)功能。该功能可在 5-30 分钟完成专业报告,支持多领域高强度知识工作者,由 o3 模型提供支持,通过端到端强化学习训练,由四模块协同工作,已在 ChatGPT 上线,未来计划扩展数据源和结合 Operator 执行复杂任务。
Anthropic 于 2025 年 1 月发布了 Agent 最佳实践指南,旨在提升 AI Agent 在多个应用场景下的效率和灵活性。还计划在 2025 年推出智能体'AI 同事'(virtual collaborator),能够编写和测试代码。其旗舰产品 Claude 3.5 Sonnet 升级版在 OSWorld 测试中电脑使用能力得分为 AI 模型中首位。
在国内,阿里云通义千问也于 1 月 29 日上线了超大规模的 MoE 模型 Qwen2.5-Max。该模型预训练数据超过 20 万亿 tokens,在多个基准测试中表现优异,整体性能优于 DeepSeek V3。
通义千问还开源了全新的视觉模型 Qwen2.5-VL,推出 3B、7B 和 72B 三个尺寸版本。Qwen2.5-VL 和 2.5MAX 不仅在性能上取得了显著提升,而且在 AI Agent 尤其是 computer use 方面展现出了强大的应用潜力。例如,Qwen2.5-VL 能够直接作为视觉 Agent 进行操作,推理并动态使用工具,支持在计算机和手机上完成多步骤的复杂任务,例如自动查询天气、预订机票、发送消息等。
各大科技公司都在用快速迭代的产品与解决方案,对外彰显其在 AI Agent 领域发展的绝对速度。从目前各领域的表现来看,2025 年这个 AI Agent 商业化应用元年,智能体的落地应用比大家想象的要快得多,预示着 AI Agent 技术即将迎来爆发式增长,当然竞争也更为激烈。
这种情况下,自然会有很多朋友想要快速认知与掌握 AI Agent。而了解一个行业最快的方式,莫过于先从阅读各种行业研报资料开始。
为了帮助大家更好地了解、学习与应用 AI Agent,在 2025 年春节假期归来开工的第一天,精心准备了 10 份智能体行业研报。
这些研报涵盖了 AI Agent 的最新技术进展、应用场景、行业趋势以及面临的挑战等多个方面,旨在为大家提供全面、深入的参考。无论是企业决策者、技术开发者还是对 AI Agent 感兴趣的读者,都可以从这些研报中获取有价值的信息,把握 AI Agent 带来的发展机遇。
报告 1:谷歌《Agents》白皮书
该白皮书探讨了生成式人工智能(Generative AI)模型如何通过使用外部工具来扩展其功能,从而形成所谓的 Agents(智能体)。详细介绍了 Agents 的定义、认知架构、关键组件、工具使用、以及如何通过这些工具和架构来增强模型性能和实现生产应用。
它首先阐明了 Agent 区别于单纯模型的关键在于其能够利用工具访问外部信息,并进行自主推理和行动规划,而非仅仅依赖训练数据进行单次预测。
白皮书详细介绍了 Agent 的三个核心组成部分:模型(Language Model)、工具(Extensions, Functions, Data Stores)和编排层(Orchestration Layer)。编排层利用各种推理框架(如 ReAct, Chain-of-Thought, Tree-of-Thoughts)指导 Agent 的决策过程。工具则赋予 Agent 与外部世界交互的能力:Extensions 连接 Agent 与 API,Functions 允许客户端控制 API 调用,Data Stores 则提供对外部数据的访问,支持 RAG 等应用。


