概念纠正
有些人总是认为 chatbot(ChatGPT、DeepSeek 等)就是 Agent,其实是错误的。
Agent = LLM(大脑) + Memory(记忆) + Planning(规划) + Tool calling(工具调用)
专业的 agent 能帮你解决专业领域的问题,自主纠错,自主解决。
目前的两大发展方向
无论是什么 AI 框架,都几乎是这两种发展方向中的一种,第一种是 workflow(工作流),第二种是 Agentic(智能体自主模式)。但有趣的是,现在的框架发展虽然大体是其中的一种,但是内部的东西正在朝着两种范式融合走。
因为纯粹的 Agent 太不可控,纯粹的 Workflow 太死板,现在行业正在往中间走,出现了一个新词叫 Flow Engineering (流程工程) 。
目前的最佳实践是:'外层是 Workflow,节点是 Agent' 或者 '大局可控,局部自主'
接下来我们就来讲讲两种模式有什么不同吧

Workflow 模式 (工作流)
这种模式认为:LLM 是一个不可靠的'函数',我们需要用可靠的代码结构把它'框'住。 它不相信 AI 的自主规划能力,而是相信人类工程师的架构设计能力。
运行机制
- 结构:显式定义
A -> B -> C的路径。 - 控制权:100% 在代码侧。你(开发者)决定何时调用 LLM,Prompt 是什么,输出怎么解析,解析失败怎么重试。
- 典型模式:
- Prompt Chaining (提示词链) :Step 1 的输出作为 Step 2 的输入。
- Router (路由) :先用一个小模型分类(是'退款'还是'咨询'?),然后
if-else走到不同的处理链路。 - Parallelization (并行) :同时让 LLM 翻译成 3 种语言,最后聚合结果。
后端视角类比
- Java: 就像
CompletableFuture的编排,或者 Spring Cloud Data Flow。 - Go: 就像通过 Channel 串联的一组 Goroutine Pipeline。
- 特点:幂等性高、延迟低、可测试。你写个单元测试,输入 A 必然得到 B(或者误差在可控范围内)。
适用场景
- RAG(检索增强生成) :搜索 -> 排序 -> 生成。路径极其固定。
- 实体提取 / 结构化数据处理:从 PDF 提取发票金额。
- 高风险业务:金融风控、医疗建议(必须有人类定义的 Checkpoint)
Agentic 模式 (智能体 / 自主模式)
核心理念:Cognitive Architecture (认知架构)
这种模式认为:LLM 是一个'大脑',我们应该给它工具和目标,让它自己找路。 它容忍过程的不确定性,以换取解决的能力。



