AI 大模型核心技术:CoT 思维链与 ReAct 推理行动
咱们之前学完了 Agent 智能体和 Tool 工具,知道了大模型可以通过调用外部工具拓展能力边界。但实际用的时候会发现:面对数学计算、多步骤决策这种复杂任务,模型要么直接给出错误答案,要么'瞎编'信息(也就是咱们说的'幻觉')。这时候该怎么办呢?
今天就来学两个能解决这个问题的核心技术——CoT(思维链) 和ReAct(推理与行动) 。它们就像给大模型装了'思考的脑子'和'动手的手脚',让模型从'直接给答案'变成'像人一样思考 + 做事',咱们一步步把它们搞懂~
一、为什么需要 CoT/ReAct?痛点太明显了!
传统大模型处理问题就像'考试直接写答案'——不管题难不难,都跳过思考过程直接给结果。这在简单问题上还行,但遇到复杂场景就拉胯了:
- 数学推理:比如'买 3 送 1 的苹果,买 8 斤哪家划算',直接算容易漏步骤算错;
- 多步骤决策:比如'订机票 + 查天气 + 预约接送机',没法一步步规划执行;
- 实时信息查询:比如'2027 年诺贝尔文学奖得主是谁',模型训练数据里没有,只能瞎编;
可解释性差:用户不知道答案是怎么来的,没法信任,也没法排查错误。

而 CoT 和 ReAct 就是为了解决这些痛点而生——核心需求很简单:让模型展示思考过程,并且能根据情况动态调整策略。
用个通俗的类比理解下:
- 普通模型 → 考试直接写答案(对错全靠蒙,不知道怎么想的);
- CoT → 在试卷上写解题步骤(知其然,也知其所以然);
- ReAct → 边查公式手册边解题(不会就查,确保答案准确)。
二、什么是 CoT(思维链,Chain of Thought)?让模型'一步步想'
2.1 CoT 核心机制

CoT 的本质很简单:通过提示词让模型显式生成推理步骤,再根据步骤得出最终答案。就像咱们解数学题一样,先分析条件、再套用公式、最后计算结果,每一步都写清楚。
它的通用格式是这样的:
问题:...[输入问题]...
思考步骤:
1. 第一步分析(如提取关键数据、明确问题目标)
2. 第二步计算(如公式应用、逻辑推导)
3. ...(更多推理步骤)
最终答案:...[根据步骤得出的结论]...
2.2 实战案例:买苹果哪家更划算?
咱们拿之前的例子实战下,感受下 CoT 的威力:
问题:A 超市苹果每斤 5 元,买 3 斤送 1 斤;B 超市同品质苹果每斤 6 元但买二送一。买 8 斤哪家更划算?
无 CoT 回答(可能出错):'A 超市划算'(没说为什么,错了也不知道哪错);
CoT 推理回答(清晰易懂):
- 先算 A 超市:买 3 送 1,实际花 3 斤的钱得 4 斤,花费 3×5=15 元 → 折合单价 15/4=3.75 元/斤;
- 买 8 斤需要 2 次活动(4×2=8 斤),总花费 15×2=30 元;



