智能系统架构设计：对话式 AI、协同驾驶与 RAG 范式

在上文中，我们介绍了何为复合人工智能系统，系统组件以及它们如何相互交互以构建复杂系统，基于 LLM 的自主智能体 —— 复合人工智能系统中的关键模块，以及复合人工智能系统的设计模式中关于定义的澄清和选择模式之前的考量。

在下文中，我们将介绍复合人工智能系统的三种部署模式。

部署模式 1：RAG / 对话式 RAG

下图显示了 RAG / 对话式 RAG 系统中各模块的主要职责，这传统上属于 IR 领域，首先通过神经搜索、知识图谱改进，然后是使用 LLM 的生成方法环。从另一个视角来看，这是一个对话式 IR 系统，当 IR 和对话系统合并，将查询视为转换上下文的对象。

对于 RAG 系统的成功，关键在于理解用户的查询并将其映射为底层知识（结构化或非结构化），并将其与适当的指令一起提供给生成器/对话管理器，这些动作可以使用一个明确定义的工作流，或者使用智能体模块，模块的动作决定执行哪些步骤。

RAG System Architecture Diagram

RAG 流程，转交给对话管理器 — 如果对话管理器是一个智能体，RAG 则成为一个工具。

来看看一些中间模块/工具，它们允许智能体在复杂的 RAG 世界中导航。

查询理解与重构

查询扩展 / 多查询

Query Expansion Diagram

使用 LLM 来扩展查询可以改进使用稀疏和统计检索器时的搜索结果。

查询重写 / 自我查询

自我查询检索器，顾名思义，具有自我查询的能力。具体来说，给定任何自然语言查询，检索器使用查询构建 LLM 链来编写结构化查询，然后将其应用于底层的 VectorStore。检索器不仅可以使用用户输入的查询与文档的内容进行语义相似性比较，还可以从用户查询中提取出文档元数据上的过滤器，并执行这些过滤器。

实体识别

查询增强

知识或意图检索

多文档搜索

对话管理

响应生成