在上文中,我们介绍了何为复合人工智能系统,系统组件以及它们如何相互交互以构建复杂系统,基于 LLM 的自主智能体 —— 复合人工智能系统中的关键模块,以及复合人工智能系统的设计模式中关于定义的澄清和选择模式之前的考量。
在下文中,我们将介绍复合人工智能系统的三种部署模式。
部署模式 1:RAG / 对话式 RAG
下图显示了 RAG / 对话式 RAG 系统中各模块的主要职责,这传统上属于 IR 领域,首先通过神经搜索、知识图谱改进,然后是使用 LLM 的生成方法环。从另一个视角来看,这是一个对话式 IR 系统,当 IR 和对话系统合并,将查询视为转换上下文的对象。
对于 RAG 系统的成功,关键在于理解用户的查询并将其映射为底层知识(结构化或非结构化),并将其与适当的指令一起提供给生成器/对话管理器,这些动作可以使用一个明确定义的工作流,或者使用智能体模块,模块的动作决定执行哪些步骤。

RAG 流程,转交给对话管理器 — 如果对话管理器是一个智能体,RAG 则成为一个工具。
来看看一些中间模块/工具,它们允许智能体在复杂的 RAG 世界中导航。
查询理解与重构
查询扩展 / 多查询

使用 LLM 来扩展查询可以改进使用稀疏和统计检索器时的搜索结果。
查询重写 / 自我查询
自我查询检索器,顾名思义,具有自我查询的能力。具体来说,给定任何自然语言查询,检索器使用查询构建 LLM 链来编写结构化查询,然后将其应用于底层的 VectorStore。检索器不仅可以使用用户输入的查询与文档的内容进行语义相似性比较,还可以从用户查询中提取出文档元数据上的过滤器,并执行这些过滤器。
实体识别
查询增强
知识或意图检索
多文档搜索
对话管理
响应生成
智能体式 RAG
智能体式 RAG 是一种设计模式,其中一个模块由 LLM 驱动,根据其可用工具集推理和规划如何回答问题。在高级场景中,可能还会连接多个智能体以创造性地解决 RAG 问题,智能体不仅能检索,还能验证、总结等。
需要细化的关键步骤和组件:
- 基于推理,子任务制定和系统化安排的计划。
- 基于自我一致性的自我纠正,由于生成多条路径和推理,基于规划的 RAG 方法(ReWoo 和 Plan+)比仅基于推理的(ReAct)效果会更好。
- 对执行的适应能力,更多元化的智能体范例。
通常,使用以下模式执行:
基于推理的智能体式 RAG
ReAct

使用搜索工具进行推理和动作。










