随着技术迭代,RAG 已从最初的简单架构发展出多种进阶形态。本文系统解析 RAG 的四大主流模式 ——Naive RAG、Advanced RAG、Modular RAG 与 Agentic RAG,从工作原理、技术特点到适用场景进行全方位对比,为技术选型提供参考。
一、RAG 基础:检索增强生成的核心逻辑
在深入模式解析前,需先明确 RAG 的核心逻辑。简单来说,RAG 由检索(Retrieval) 与生成(Generation) 两大模块构成:
检索模块:从预设知识库中精准定位与用户问题相关的信息片段(如文档、段落、句子);
生成模块:基于检索到的信息,结合大语言模型生成符合上下文、逻辑连贯的答案。

这种'先检索再生成'的模式,既保留了 LLM 的语言理解与生成能力,又通过外部知识的引入弥补了模型训练数据过时、事实准确性不足的缺陷。而四大模式的差异,本质上是对'检索效率''生成质量''系统灵活性'的不同优化方向。
二、Naive RAG:RAG 的'入门款',简单直接的基础架构
2.1 工作原理:线性流程的基础实现
Naive RAG 是 RAG 的原始形态,架构极简,核心流程为'单轮检索 + 直接生成':

首先用户输入问题,比如询问'什么是 RAG 技术?'。接着检索器(通常基于关键词匹配或基础向量检索)从知识库中筛选出少量相关文档,大概 3 到 5 篇。最后生成器(如 GPT-3.5)直接拼接检索到的文档片段与问题,输出答案。
其核心特点是无优化环节:检索器不做重排序,生成器不做上下文过滤,分块策略简单(如固定长度切割文档),整个流程是不可逆的。
2.2 技术特点:简单易实现,局限显著
它的优势在于架构简单,开发成本低,适合快速搭建原型;同时对硬件资源要求低,可在小规模知识库(如万级文档)上稳定运行。
但缺点也很明显。检索精度低:依赖关键词或基础向量匹配,易遗漏语义相关但表述不同的内容(如


