引言:大模型时代的 APP
当前,通往通用人工智能(AGI)的探索路线有很多,而 AI Agent 有望成为未来产品的主流。AI Agent 是一种任何人都可以尝试构建的个性化应用,如果说大模型是工程师的技术游戏,那么 AI Agent 则像是每个人都能玩的乐高。
李彦宏认为,AI 时代制作一个智能体就和在互联网时代制作网站一样简单。未来各行各业都会基于各自领域的具体场景,制作出几百万甚至更大量的智能体。智能体是 AI 时代的网页。
周鸿祎认为,AI Agent 将激发大模型潜能成为超级生产力工具。
吴恩达认为,智能体的发展将会成为 AI 时代重要的力量,甚至比基础模型还要重要。
场景假设
想象一下,我们要写一本 10 万字的书,主题是'人工智能与前端开发最新技术'。在没有大模型之前,我们通常是按照以下传统方式这么操作的。
传统方式
- 搜索信息:使用搜索引擎查找相关书籍、资料和信息,打开思路,然后给自己一个方向。
- 制定大纲:根据查到的资料,确定这本书的整体框架,每一章节的大概内容。
- 逐章编写:按照大纲,逐章写内容。过程中,可能会根据新想法或新发现不断调整大纲。
- 回顾修改:在写后面的章节时,得时不时翻回去看之前的内容,确保上下文一致、逻辑通畅。
- 找人帮忙修改:写完后,通常需要找相关领域的专家帮忙审阅、修改。
- 反复调整,最终定稿:经过几轮修改和调整,书籍才算最终成型。
使用大模型
有了大模型之后,事情听起来好像简单多了,我们可以直接跟 AI 说:'你是一个技术和写作专家,请你帮我写一本 10 万字的书,主题是'人工智能与前端开发最新技术'。'
结果呢? 你很快就会发现 AI 写出来的书根本不能看,没法阅读,为什么?
因为大模型生成的内容存在几个关键问题:
- 无法获取最新信息:大模型的训练数据是有时效性的,它不能像我们一样去 Google 获取最新资料和信息,所以内容很可能过时。
- 缺乏整体规划:AI 生成的内容通常是按句子或段落生成的,没有像我们写书那样先有大纲,再逐步展开。所以内容容易散乱、缺乏结构。
- 记忆能力有限:大模型对上下文的记忆有局限,无法处理像 10 万字这么长的文本。这就导致,前后内容可能自相矛盾,前言不搭后语。
AI Agent 可以解决这些问题
相比于单纯的大模型,AI Agent 能够结合规划、记忆和工具,解决这些问题。

AI Agent 概念
智能体的概念源自哲学,可以追溯到亚里士多德和休谟等思想家。他们认为智能体是拥有欲望、信念、意图和采取行动能力的实体。这一概念后来被引入计算机科学,用于让计算机理解用户兴趣并自主执行操作。
AI Agent,或称为人工智能代理,人们更愿意称为 AI 智能体。它是模拟人类智能行为的系统,核心是大型语言模型(LLM)。这些智能体能够感知环境、做出决策,并执行任务以实现特定目标。设计 AI Agent 的理念是赋予机器自主性、适应性和交互性,使其能够在复杂多变的环境中独立运作。
这种 Agent 既可以是软件形式的程序,例如对话机器人,也可以具备物理形态,比如扫地机器人。
AI Agent 组成与架构
组成公式
AI Agent = LLM(大模型) + Planning(规划) + Memory(记忆) + Tools(工具)
架构图
简而言之:
- 记忆是关于存储信息
- 规划是关于将目标分解为小任务













