Agent 像人一样思考：主流思维链范式与最佳实践 | 极客日志

编程语言AI算法

Agent 像人一样思考：主流思维链范式与最佳实践

详细探讨了如何引导大语言模型像人一样思考，重点解析了多种思维链（Chain-of-Thought）范式及其应用场景。内容包括基础的 Zero-shot 和 Few-shot CoT，进阶的 Self-Consistency、Least-to-Most，以及高级的 ToT、GoT、AoT、SoT 和 PoT 等推理方法。文章通过 SQL 质检等实例演示了各范式的 Prompt 编写技巧，并提供了关于 Agent 架构设计、多模型协作、成本控制及安全性评估的最佳实践建议。旨在帮助开发者在实际项目中选择合适的推理策略，平衡效果与性能。

王者发布于 2025/2/7更新于 2026/7/1943 浏览

前言

Agent（智能体）是模型面向应用的中间层，通常理解为一个类人的智能系统。为了让 Agent 更像人类，我们需要引导底层大语言模型像人一样进行思考和推理。

思维链（Chain-of-Thought, CoT）作为一种引导模型思考的方法被广泛使用，它通过显式地展示推理步骤来增强模型的决策能力。

什么是思维链 CoT（Chain-of-Thought）

思维链被认为是最具开拓性和影响力的提示工程技术之一，它可以显著增强大型语言模型在复杂决策过程中的表现。

与传统的提示方法强调直接的输入和输出互动不同，CoT 迫使模型将推理过程划分为中间步骤。这种方法模拟了人类的认知过程，将复杂的挑战分解为更小、更易于管理的部分。

通俗点说，就是引导模型一步一步思考，最终得到答案，而不是直接猜测结果。

CoT 的原理

CoT 的原理目前学术界仍在探索中，通常认为和两个关键因素有关：一是模型的参数量要足够大（通常超过 100B），二是模型需要在代码数据或逻辑推理数据上做过专门训练。

那思维链能达到一个什么程度？参考相关论文中的对比实验，效果如下：

参数越大，思维链效果越明显，在 100B 左右甚至会出现性能突变
参数足够大时，思维链效果要超过标准指令（Standard Prompting）
参数足够大时，思维链效果接近，甚至超过有监督微调的效果

受限于模型架构、训练方式、数据质量等因素，实际效果会有一定差异。

CoT 的使用

不再是一步到位得出答案，CoT 的本质是让模型逐步推理，最终得出答案。

最初的 CoT 主要有两种使用姿势：Zero-shot CoT 和 Few-shot CoT。

Zero-shot CoT

其实大模型是非常聪明的，我们只需要告诉它一步步执行，就能达到基本效果。

问题示例：两辆汽车从相距 500 千米的两城同时出发，相向而行．一辆摩托车以每小时 80 千米的速度在两辆汽车之间不断往返联络．已知这两辆汽车的速度分别是每小时 40 千米和 60 千米，求两汽车相遇时，摩托车共行驶了多少千米。

正确答案计算逻辑：500/(40+60)*80 = 400 千米。

我们用 GPT-3 测试一下，先用空 prompt 测试，模型回复往往比较随机，有时对有时不对，效果不明显，这与其训练数据分布有关。

当 prompt 变为 Let's think step by step 时，模型回复会有明显改善：

我们可以先计算出两辆汽车相遇所需的时间，然后再计算摩托车在这段时间内行驶的距离。
两辆汽车相对于对方的速度是 60 千米/小时 + 40 千米/小时 = 100 千米/小时。他们之间的距离是 500 千米，所以他们相遇所需的时间为 500 千米 / (100 千米/小时) = 5 小时。
摩托车以每小时 80 千米的速度在两辆汽车之间不断往返联络，所以在 5 小时内，摩托车的行驶距离为 5 小时 × 80 千米/小时 = 400 千米。
所以摩托车共行驶了 400 千米。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

## 设定
根据输入的 sql 语句，指出存在的问题。

存在的问题是缺少 WHERE 子句来指定更新的行数。这将导致所有学生的姓名都被更改为"张三"。

## 示例
示例一：
输入：select * from user where a=1 -- name = '张三'
思考过程：
1. 词法分析，不存在问题
2. 语法分析，不存在问题
3. 操作风险：当数据表中行数较多时，会查询出大量数据
4. 安全风险：可能存在注入，因为 -- 后面通常不放置变量条件
输出：
该 sql 语句存在风险：
1. 当数据表中行数较多时，会查询出大量数据
2. 可能存在注入，因为 -- 后面通常不放置过滤条件

该 sql 语句存在问题：
1. 缺少 WHERE 条件，将会更新所有学生的姓名为"张三"，可能导致数据混乱。
2. 缺少引号，应该是'张三'而不是张三

## 设定
根据输入的 sql 语句，指出存在的问题。

## 示例
示例一：
输入：select * from user where 1=1 -- name = '张三'
输出：可以拆分这些子问题："词法分析是否正确"，"语法分析是否正确"，"是否存在操作风险"，"是否存在注入风险"
输入：词法分析是否正确
输出：正确
输入：语法分析是否正确
输出：正确
输入：是否存在操作风险
输出：存在风险，会查询出大量数据
输入：是否存在注入风险
输出：存在注入风险，sql 中--后面通常不加筛选条件

//第一轮对话
user: update student set name = 张三
gpt4: 可以拆分这些子问题： "词法分析是否正确"，"语法分析是否正确"，"是否存在操作风险"，"是否存在注入风险"

//第二轮对话
user: 词法分析是否正确
gpt4: 不正确，更新的值应该用引号包裹，例如 name = '张三'，而不是 name = 张三。

//第三轮对话
user: 语法分析是否正确
gpt4：不正确，因为在 SET 子句中对 name 列赋值时，'张三'应该被单引号括起来。正确的语句应该是：update student set name = '张三'

//第四轮对话
user: 是否存在操作风险
gpt4: 存在风险。此条更新语句没有使用 WHERE 子句进行条件限制，会导致表中的所有记录的 name 都被更新为 '张三'，这可能是一种误操作。常规情况下，我们建议在执行更新操作时始终使用 WHERE 子句来限定被更新的记录。

//第五轮对话
user: 是否存在注入风险
gpt4: 在这个例子中，不存在 SQL 注入的风险。因为这条语句没有动态链接输入，也没有暴露出可以被利用来注入恶意 SQL 代码的漏洞。但是，SQL 注入通常出现在将未经过滤或未经适当处理的用户输入直接连接到 SQL 查询中的情况。

//第六轮：总结答案
user: 总结一下，存在哪些问题
gpt4:
这条 SQL 语句存在两个主要的问题：
1. 词法错误：在 SET 子句中对 name 列赋值时，字符串值 '张三' 没有被单引号括起来。
2. 操作风险：SQL 语句没有使用 WHERE 子句进行条件限制，这可能导致 student 表中所有记录的 name 都被更新为 '张三'，很可能是一种误操作。
需要注意轻易不要在没有指定 WHERE 子句的情况下执行 UPDATE 操作，以防对数据库中的大量数据进行无意的修改，除非你确实打算进行全表更新。同时在执行 SQL 语句时要格外注意词法和语法规则，以确保 SQL 语句的正确性。

## 设定
根据输入的 sql 语句，找到 sql 可能存在的问题。

## 示例
示例一：
输入：select * from user wher age=18 -- name = '张三'
输出：
1. 需要验证的方向："语法分析是否正确"，"是否存在安全风险"。
2. 语法分析需要验证的子项："表名是否合法"，"关键字是否正确"。
3. 安全风险需要验证的子项："影响数据量"，"是否存在 sql 注入"。
总结：
- 存在 sql 注入，-- 符号后面通常不加过滤条件
- 存在关键字错误，wher 应该为 where

1. 需要验证的方向："语法分析是否正确"，"是否存在安全风险"。
2. 语法分析需要验证的子项："表名是否合法"，"关键字是否正确"，"数据类型是否正确"。
3. 安全风险需要验证的子项："影响数据量"，"是否存在 sql 注入"。
总结：
- 表达式 "name = 张三" 中的 "张三" 应该为字符串类型，需要加上引号，正确的写法应为 "name = '张三'"。
- 需要注意该语句没有 where 条件，更新的数据会影响整个 student 表，可能存在数据被错误修改的风险。

## 设定
根据输入，生成 sql 语句。

## 示例
输入：我叫王大锤，今年 21
输出：insert into user('name','age') values('王大锤',21);

Agent 像人一样思考：主流思维链范式与最佳实践

前言

什么是思维链 CoT（Chain-of-Thought）

CoT 的原理

CoT 的使用

Zero-shot CoT

更多推荐文章

相关免费在线工具

Few-shot CoT

进阶用法：Self-Consistency

进阶用法：Least-to-Most

思维树 Tree-of-Thoughts (ToT)

思维图谱 Graph-of-Thoughts（GoT）

思维算法 Algorithm-of-Thoughts（AoT）

思维框架 Skeleton-of-Thought（SoT）

程序思维 Program-of-Thoughts (PoT)

最佳实践

1. DAG 还是流程图？

2. 为了达到更好的效果，优化模型还是优化 Agent？

3. 多模型还是多 Agent？

4. 如何选择推理过程？

5. 项目刚开始不强制用思维链。

6. 例子太多怎么办？

7. 用了思维链之后，模型耗时增加非常严重怎么办？

评估指标与成本考量

安全与隐私注意事项

尾语

更多推荐文章

相关免费在线工具

Agent 像人一样思考：主流思维链范式与最佳实践

前言

什么是思维链 CoT（Chain-of-Thought）

CoT 的原理

CoT 的使用

Zero-shot CoT

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

Few-shot CoT

进阶用法：Self-Consistency

进阶用法：Least-to-Most

思维树 Tree-of-Thoughts (ToT)

思维图谱 Graph-of-Thoughts（GoT）

思维算法 Algorithm-of-Thoughts（AoT）

思维框架 Skeleton-of-Thought（SoT）

程序思维 Program-of-Thoughts (PoT)

最佳实践

1. DAG 还是流程图？

2. 为了达到更好的效果，优化模型还是优化 Agent？

3. 多模型还是多 Agent？

4. 如何选择推理过程？

5. 项目刚开始不强制用思维链。

6. 例子太多怎么办？

7. 用了思维链之后，模型耗时增加非常严重怎么办？

评估指标与成本考量

安全与隐私注意事项

尾语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具