RAG 技术演进与七大架构深度解析
背景与现状
2024 年即将结束,回望这两年,大模型 RAG(检索增强生成)技术的发展可谓跌宕起伏。2023 年是 RAG 的萌芽期,行业在摸索中前进;2024 年上半年 RAG 到达狂热顶点,各种方案层出不穷;然而到了 2024 年下半年,实际落地情况并不理想,普遍面临'一周出 demo,半年不交付'的困境。
本文回顾了 2023 至 2024 年 RAG 技术的发展历程,从萌芽期到狂热顶点再到落地困境,分析了当前处于技术成熟度曲线的低谷期。展望 2025 年,RAG 将回归理性,强调明确业务需求与指标。文章详细解析了七种主流 RAG 技术架构,包括朴素 RAG、检索重排序、多模态 RAG、图 RAG、混合 RAG、代理 RAG 及多智能体 RAG,探讨了各自的技术特点、优势与适用场景,为开发者提供落地参考。

2024 年即将结束,回望这两年,大模型 RAG(检索增强生成)技术的发展可谓跌宕起伏。2023 年是 RAG 的萌芽期,行业在摸索中前进;2024 年上半年 RAG 到达狂热顶点,各种方案层出不穷;然而到了 2024 年下半年,实际落地情况并不理想,普遍面临'一周出 demo,半年不交付'的困境。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
根据 Gartner 的 Hype Cycle(技术成熟度曲线),当前 RAG 技术正逐渐进入狂热之后的低谷期。这意味着市场需要冷静下来,从追求概念转向追求实效。
展望 2025 年,RAG 技术将回归理性。企业和技术团队应关注以下几点:
这两年,大模型 RAG 技术侧也经历了快速迭代与演化:
以下详细解析七种主流的大模型 RAG 技术架构。
Naive RAG(朴素 RAG)是最基础的架构。它直接从文档中检索块(Chunks),然后使用查询(Query)通过向量数据库进行检索。系统结合检索到的上下文(Retrieved context)和原始查询,通过生成模型(如 LLM)直接生成响应。
特点:实现简单,成本低,但容易受检索质量影响,缺乏优化机制。
Retrieve-and-rerank(检索并重排序)属于高级 RAG 技术,可以在流程的各个阶段部署优化策略:
特点:显著提升了召回率和准确率,是工业界的主流选择。
当前的传统 RAG 系统仅基于文本,这使得无法利用在现实世界多模态文档中扮演关键角色的视觉信息,如布局、图像和图表。
MM-RAG(Multimodal RAG)框架通过直接将文档图像嵌入到视觉语言模型(VLM)中来检索和生成信息,从而绕过了传统的文本解析阶段。它能够理解图片内容及其与文本的关系,适用于包含大量图表、公式或复杂排版的文档处理场景。
特点:突破了纯文本限制,增强了非结构化数据的处理能力。
Graph RAG(图检索增强生成)引入了知识图谱的概念。其优势在于可以回答涉及整个外部知识库的问题并得出结论,能够捕捉实体间的关系,支持复杂的推理任务。
挑战:最大的问题在于落地难度大,构建高质量的知识图谱成本高,且维护复杂。
特点:适合需要全局理解和逻辑推理的场景,如金融风控、医疗诊断辅助。
Hybrid RAG(混合 RAG)结合了多种检索技术,可能包括文本检索、向量检索和图检索,旨在提高检索的准确性和效率。它不依赖单一的数据表示方式,而是根据查询类型动态选择或融合不同来源的信息。
特点:鲁棒性强,能够应对多样化的查询需求。
AI Agent 是可以解释信息、制定计划和做出决策的自主系统。当添加到 RAG 流程中时,Agent 可以重新制定用户查询,Agentic RAG 还可以处理需要多步骤推理的更复杂查询。
例如,Agent 可以先决定需要检索哪些数据,再调用工具验证信息,最后生成答案。这种模式赋予了 RAG 更强的主动性和规划能力。
特点:解决了复杂任务分解和执行的问题,适合自动化工作流。
单智能体系统也有其局限性,因为它仅限于一个 Agent 进行推理、检索和答案生成。因此,将多个智能体链入 Multi-Agent RAG 应用是有益的。
在这种架构下,不同的 Agent 可以扮演不同角色,如检索专家、分析专家、写作专家等。它们之间通过协作完成复杂的任务,类似于人类团队的分工合作。
特点:扩展性强,能够处理超大规模或高度专业化的任务。
RAG 技术正处于从概念验证向规模化落地转型的关键阶段。虽然面临落地困难和预期落差,但随着架构的多样化和工具的成熟,未来仍有广阔空间。开发者应聚焦于解决具体的业务痛点,选择合适的架构组合,稳步推进 RAG 应用的落地。