跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
PythonAI算法

LLM Agent 工作流 Prompt 设计精解:规划、反思与工具调用

综述由AI生成深入解析了 LLM Agent 的四种核心工作流 Prompt 设计模式,包括规划(ReAct 与 CoT)、反思(Reflexion)、工具调用及多智能体协作。文章强调了高质量 Few-Shot 示例的重要性,指出没有万能 Prompt,需结合特定任务设计。内容涵盖了 TAO 循环机制、自我纠错流程、工具参数防捏造策略以及多角色分工原理。此外,还补充了避免幻觉、结构化输出、迭代优化及安全防御等最佳实践,旨在帮助开发者构建更稳定、高效的智能体系统。

莫名其妙发布于 2025/2/6更新于 2026/4/256 浏览
LLM Agent 工作流 Prompt 设计精解:规划、反思与工具调用

LLM Agent 工作流 Prompt 设计精解

在大型语言模型(LLM)向智能体(Agent)演进的过程中,Prompt 工程不仅是交互的接口,更是控制智能体行为逻辑的核心。通过实测多种 Agentic 工作流框架,包括反思(Reflection)、工具调用(Tool Use)、规划(Planning)和多智能体协作,我们发现精心设计的 Prompt 是提升任务成功率的关键。

核心原则:没有万能 Prompt

对于特定任务,不存在通用的万能 Prompt,只有适配场景的通用模式。要完成复杂任务,必须结合任务特定的 Few-Shot Examples。此外,必须给予模型明确的指令约束和强烈的鼓励机制(如使用 MUST、奖励机制等),这能显著提高模型遵循指令的准确性。

一个精心设计且针对特定任务的 Prompt 通常包含以下五个部分:

  1. 解决任务的方法:明确定义推理路径或行动准则。
  2. 任务的输入和输出:规定数据格式和返回结构。
  3. 任务的 Example:提供 3 到 5 个高质量的参考示例(Few-Shot)。
  4. 任务的历史纪录:如果涉及多轮对话或迭代,需包含上下文。
  5. 用户输入的问题:当前的具体查询。

1. 规划 Prompt 设计案例

ReAct (Reasoning + Acting)

ReAct 提供了一种更易于人类理解、诊断和控制的决策和推理过程。其典型流程是一个循环:思考(Thought)→ 行动(Action)→ 观察(Observation),简称 TAO 循环。

  • 思考(Thought):面对问题,深入分析如何定义问题、确定关键信息和推理步骤。
  • 行动(Action):根据思考方向,采取具体措施或执行任务,推动问题解决。
  • 观察(Observation):观察行动结果,检验有效性及是否接近答案。

通过循环迭代上述流程,模型能够逐步逼近正确答案。以下是 ReAct 的 Prompt 设计示例,包含了方法说明、输入输出规范、样例和用户问题:

prompt_template = """
用交替进行的"思考、行动、观察"三个步骤来解决问答任务。
思考可以对当前情况进行推理,而行动必须是以下三种类型之一:
(1) Search[entity]:在知识库中搜索确切的实体,并返回第一个段落。
(2) Lookup[keyword]:在上一次成功通过 Search 找到的段落中返回包含关键字的下一句。
(3) Finish[answer]:返回最终答案并结束任务。

你可以采取必要的步骤。确保你的回应必须严格遵循上述格式。

以下是一些参考示例:
问题:科罗拉多造山运动东部地区的海拔范围是多少?
思考 1:我需要搜索科罗拉多造山运动,找到该运动东部地区的范围,然后查找海拔信息。
行动 1:Search[科罗拉多造山运动]
观察 1:科罗拉多造山运动是科罗拉多州及周边地区的一次造山运动。
思考 2:它没有提到东部地区的具体海拔,需要进一步查找。
行动 2:Lookup[东部地区 海拔]
...

Question:{question}
{scratchpad}
"""

CoT (Chain of Thought)

为了让模型按照思维链方式思考,必须提供针对特定任务的 Example。CoT 强调分步思考,而非简单的直接回答。在 Reflexion 框架中,CoT 式 Prompt 的设计如下:

cot_instruction = """
通过思考来解决问答任务,然后用你的答案完成任务。
思考可以推理当前情况。Finish[answer] 返回答案并完成任务。
你将获得一些背景信息,你应该利用这些信息来帮助你回答问题。

以下是一些示例:
{examples}
(END OF EXAMPLES)

相关背景:{context}
问题:{question}{scratchpad}
"""

2. 反思 Prompt 设计案例

反思(Reflexion)是一种在现有问答基础上指导模型进行自我优化和排除错误答案的过程。当模型未能成功回答问题时,通过反思历史尝试,诊断失败原因并制定新计划。

Prompt 设计

reflection_prompt = """
你是一个能够通过自我反思来改进的高级推理代理。
你将获得之前的推理测试流程。由于你猜错了答案或用完了设定的推理步骤数,你未能成功回答问题。
请诊断失败的可能原因,并制定一个新的、简明的高级计划,旨在减轻同样的失败。
要求必须使用完整的语句来回复。

这里有一些例子:
{examples}

之前的尝试:
问题:{question}
{scratchpad}
反思:
"""

示例

之前的尝试:
问题:《罗马议定书》由三位总理签署,其中一位被暗杀是作为什么的一部分?
思考 1:我需要搜索《罗马议定书》,找到这三位总理。
行动 3:完成 [第二次世界大战]

反思:我搜索了参与签署的一位总理,然后试图立即回答。我应该搜索每位总理,然后查看每位总理的'死亡'信息,以获取更多信息后再回答。

3. 工具调用 Prompt 设计案例

当拥有大量工具函数时,无法将所有 Tools 发送给 LLM,因为这会超过 Token 限制。处理策略包括分组选择、优先级排序等。

HuggingGPT 案例

HuggingGPT 使用 HuggingFace 的模型进行推理任务。当时 HuggingFace 上有约 673 个模型,接口描述字符量巨大。解决方案是将模型分类为 19 个类别(15 个 NLP,2 个 Audio,3 个 CV)。Prompt 设计需引导模型解析任务依赖关系。

任务必须从以下选项中选择:
"token-classification", "text2text-generation", "summarization", ...
逐步思考解决用户请求所需的所有任务。解析出尽可能少的任务,同时确保能够解决用户请求。
注意任务之间的依赖关系和顺序。如果无法解析用户输入,你需要回复空 JSON [],否则必须直接返回 JSON。

参数安全提示

在使用工具调用时,大模型有时会捏造参数。必须在 Prompt 中明确提示不要捏造任何参数,如果未提供,应请求用户提供。这需要针对不同模型多次尝试优化。

4. 多智能体 Prompt 设计

多智能体系统的有效性源于人类的分工合作思想。如果给单个 Prompt 设定过多不同任务,可能导致模型无法准确跟随指令。因此,为不同的智能体设计专用的 Prompt 能让它们工作更高效。

合作使我们能够知道比我们自己所能知道的更多。它赋予我们不同的思维方式,让我们接触到原本无法获得的信息,并在共同努力实现共同目标的过程中将想法结合起来。

在多智能体架构中,通常包含管理者(Manager)、执行者(Worker)和审查者(Reviewer)。每个角色都有独立的 System Prompt,专注于特定职责。

5. 最佳实践与安全建议

5.1 避免幻觉

在 Prompt 中明确禁止模型编造事实。对于不确定的信息,要求模型声明'我不知道',而不是猜测。

5.2 结构化输出

强制模型输出 JSON 或特定格式,便于程序解析。使用正则表达式或 Schema 验证输出内容。

5.3 迭代优化

Prompt 设计不是一次性的。需要通过 A/B 测试,对比不同 Few-Shot 示例的效果,持续调整指令权重。

5.4 安全性

防止 Prompt Injection。对用户输入进行清洗,限制模型可访问的工具权限,避免敏感信息泄露。

总结

本文详细解析了 LLM Agent 的四种核心工作流:规划(ReAct/CoT)、反思(Reflexion)、工具调用(Tool Use)以及多智能体协作。关键点在于:

  1. 示例驱动:高质量 Few-Shot 示例是提升准确率的基础。
  2. 约束明确:清晰的指令和格式限制能减少模型自由发挥带来的风险。
  3. 自我修正:引入反思机制允许模型在失败中学习,提高鲁棒性。
  4. 模块化:将复杂任务拆解为子任务,分配给不同模块或智能体处理。

掌握这些设计模式,能够帮助开发者构建更稳定、更智能的 LLM 应用系统。

目录

  1. LLM Agent 工作流 Prompt 设计精解
  2. 核心原则:没有万能 Prompt
  3. 1. 规划 Prompt 设计案例
  4. ReAct (Reasoning + Acting)
  5. CoT (Chain of Thought)
  6. 2. 反思 Prompt 设计案例
  7. Prompt 设计
  8. 示例
  9. 3. 工具调用 Prompt 设计案例
  10. HuggingGPT 案例
  11. 参数安全提示
  12. 4. 多智能体 Prompt 设计
  13. 5. 最佳实践与安全建议
  14. 5.1 避免幻觉
  15. 5.2 结构化输出
  16. 5.3 迭代优化
  17. 5.4 安全性
  18. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • 💰 8折买阿里云服务器限时8折购买
  • 🦞 5分钟部署阿里云小龙虾了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 小型语言模型(SLM)技术最新全面综述
  • 大模型技术入门与学习路线详解
  • 网络安全基础入门教程与学习路线规划
  • AI 产品经理核心能力培养与学习路径规划
  • 程序员转行大模型领域:热门岗位与学习路径解析
  • 本地部署 DeepSeek R1 模型并集成到 Word 中
  • RAG 技术详解:破解大模型知识、幻觉与安全困境
  • Python 转行程序员:决策逻辑与学习路径指南
  • 本地部署开源大语言模型框架 Ollama 入门指南
  • Android Jetpack ViewBinding 视图绑定详解与封装优化
  • Android 进阶学习笔记:从架构筑基到性能优化实战指南
  • Flutter 与 Kotlin 对比:移动应用开发选型指南
  • Python 自动化办公与数据采集实战指南
  • 零基础学习 Python 的可行性分析与入门指南
  • AI产品经理必备技能与职业发展路径指南
  • 一次红队渗透实战项目记录
  • ChatGPT 插件自动写书实战及插件知识库构建方法
  • Python 基础入门:标识符、关键字与基本语句详解
  • 30 个数据工程必备的 Python 包
  • 新手如何从零开始学习漏洞挖掘与渗透测试

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online