我们在之前的讨论中提到过 Agent 的四种核心工作流:反思、工具使用、推理和多智能体协作。此前,我们已从论文和代码层面分别讲解了大语言模型(LLM)中 Agent 的反思机制与工具使用模式。本文将深入探讨 Agentic Design Pattern 中的第三部分——规划工作流(Planning)。
规划是指利用大语言模型自主决策如何拆分任务,以完成更大或更复杂的任务。许多复杂任务无法通过单个指令或单次工具调用解决,但 Agent 可以自主决定将任务拆分为更小的子任务。例如,判断输入图像中是否包含特定人物,LLM 可能考虑的步骤包括:检测是否存在人脸、截取人脸区域、调用人脸匹配库、输出结果。
规划是一种非常强大的能力,但由于 LLM 的自主决策特性,其结果往往难以预测。Andrew Ng 曾指出,反射(Reflection)和使用工具(Tool Use)这两种 Agent 设计模式是可以可靠工作的,并能显著提高应用程序性能;而规划是一种相对不成熟的技术,很难在事前准确预测其行为。尽管如此,该领域正在快速发展,规划能力的提升值得期待。
1. Chain of Thought Prompting(思维链提示)
思维链提示(Chain-of-Thought Prompting, CoT)旨在引导大型语言模型进行显式的逐步推理。研究表明,通过在提示中明确展示中间推理步骤,可以显著提高模型在复杂推理任务上的表现。
传统的提示通常直接提供问题和答案,而思维链提示则在两者之间插入多个中间推理步骤。这样做不仅帮助模型理解问题的结构,还能引导其逐步推导出正确答案。实验涵盖了数学问题、常识推理和代码生成等多种任务。思维链提示在各类推理任务中均显著提升了模型的表现。例如,在解决数学题时,思维链提示比传统提示方法提高了模型的准确率。此外,模型规模越大,思维链提示的效果越显著,这表明大型模型具有更强的推理和理解能力。下图表明模型在至少要在 8B 以上才会有明显的提升。
以论文对于推理数学问题的 Prompt 为例:
Here's examples when you are answer.
Q: There are 15 trees in the grove. Grove workers will plant trees in the grove today. After they are done, there
will be 21 trees. How many trees did the grove workers plant today?
A: There are 15 trees originally. Then there were 21 trees after some more were planted. So there must have
been 21 - 15 = 6. The answer is 6.
...
Q: Olivia has $23. She bought five bagels for $3 each. How much money does she have left?
A: Olivia had 23 dollars. 5 bagels for 3 dollars each will be 5 x 3 = 15 dollars. So she has - dollars left.
- . The answer .
Tracy used a piece wire feet support tomato plants the garden. The wire was cut pieces inches . How many pieces did she obtain?


