AI Agent 设计模式实战:ReAct 架构详解
随着人工智能技术的不断进步,AI Agent 设计模式逐渐成为研究和应用的热点。ReAct 模式作为 AI Agent 设计模式的起点,以其模拟人类思考和行动过程的特点,为各种智能应用提供了一种有效的实现途径。

ReAct 模式最早出现的 Agent 设计模式,目前也是应用最广泛的。从 ReAct 出发,有两条发展路线:
一条更偏重 Agent 的规划能力,包括 REWOO、Plan & Execute、LLM Compiler。
另一条更偏重反思能力,包括 Basic Reflection、Reflexion、Self Discover、LATS。

在后续文章中,将沿着上图的脉络,结合产品流程和源代码,详细介绍这八种 AI Agent 设计模式。选择结合源代码的原因在于,在 AI 大模型时代,很多的概念和方法都太新了。只有结合源代码,产品经理才能真正理解背后的原理和逻辑,才能知道什么能做,什么不能做,AI 的边界在哪里,以及该如何与人类经验配合。
下面,我们先从 ReAct 模式开始。
一、ReAct 的概念
ReAct 的概念来自论文《ReAct: Synergizing Reasoning and Acting in Language Models》,这篇论文提出了一种新的方法,通过结合语言模型中的推理(reasoning)和行动(acting)来解决多样化的语言推理和决策任务。ReAct 提供了一种更易于人类理解、诊断和控制的决策和推理过程。
它的典型流程如下图所示,可以用一个有趣的循环来描述:思考(Thought)→ 行动(Action)→ 观察(Observation),简称 TAO 循环。
- 思考(Thought):面对一个问题,我们需要进行深入的思考。这个思考过程是关于如何定义问题、确定解决问题所需的关键信息和推理步骤。
- 行动(Action):确定了思考的方向后,接下来就是行动的时刻。根据我们的思考,采取相应的措施或执行特定的任务,以期望推动问题向解决的方向发展。
- 观察(Observation):行动之后,我们必须仔细观察结果。这一步是检验我们的行动是否有效,是否接近了问题的答案。
- 循环迭代:如果观察到的结果并不匹配我们预期的答案,那么就需要回到思考阶段,重新审视问题和行动计划。这样,我们就开始了新一轮的 TAO 循环,直到找到问题的解决方案。

和 ReAct 相对应的是 Reasoning-Only 和 Action-Only。在 Reasoning-Only 的模式下,大模型会基于任务进行逐步思考,并且不管有没有获得结果,都会把思考的每一步都执行一遍。在 Action-Only 的模式下,大模型就会处于完全没有规划的状态下,先进行行动再进行观察,基于观察再调整行动,导致最终结果不可控。

假设我们正在构建一个智能助手,用于管理我们的日程安排。

