RAG 技术演进与七大架构深度解析
背景与现状
2024 年即将结束,回望这两年,大模型 RAG(检索增强生成)技术的发展可谓跌宕起伏。2023 年是 RAG 的萌芽期,行业在摸索中前进;2024 年上半年 RAG 到达狂热顶点,各种方案层出不穷;然而到了 2024 年下半年,实际落地情况并不理想,普遍面临'一周出 demo,半年不交付'的困境。
根据 Gartner 的 Hype Cycle(技术成熟度曲线),当前 RAG 技术正逐渐进入狂热之后的低谷期。这意味着市场需要冷静下来,从追求概念转向追求实效。
2025 年展望:回归理性
展望 2025 年,RAG 技术将回归理性。企业和技术团队应关注以下几点:
- 找到最小业务切入点:明确具体需求,避免为了用 AI 而用 AI。
- 定好指标:建立可量化的评估体系,确保效果可衡量。
- 做好标杆案例:先打造 RAG 落地的标杆项目,降低试错成本,谁都不愿意当小白鼠。
- 持续跟进新技术:保持对前沿技术的敏感度,如 o3、GPT-5 等新一代模型的发布可能带来新的范式。
技术侧的快速发展
这两年,大模型 RAG 技术侧也经历了快速迭代与演化:
- 2023 年 RAG 模块迭代:从朴素 RAG 发展到高级 RAG,再到模块化 RAG。
- 2024 年 RAG 框架演化:从基础 RAG 到 MM-RAG/GraphRAG,再到 Agentic RAG。
以下详细解析七种主流的大模型 RAG 技术架构。
1. Naive RAG 框架
Naive RAG(朴素 RAG)是最基础的架构。它直接从文档中检索块(Chunks),然后使用查询(Query)通过向量数据库进行检索。系统结合检索到的上下文(Retrieved context)和原始查询,通过生成模型(如 LLM)直接生成响应。
特点:实现简单,成本低,但容易受检索质量影响,缺乏优化机制。
2. Retrieve-and-rerank 框架
Retrieve-and-rerank(检索并重排序)属于高级 RAG 技术,可以在流程的各个阶段部署优化策略:
- 预检索策略:如元数据过滤和文本块分割,提高检索效率和相关性。
- 检索技术:采用混合搜索,结合相似性搜索和关键词搜索的优势。
- 重排序:使用排名模型重新对检索结果进行排序,确保最相关的信息排在前面。
- 微调生成:使用在特定领域数据上微调的生成性 LLM,有助于提高生成结果的质量。
特点:显著提升了召回率和准确率,是工业界的主流选择。
3. MM-RAG 框架(多模态 RAG)
当前的传统 RAG 系统仅基于文本,这使得无法利用在现实世界多模态文档中扮演关键角色的视觉信息,如布局、图像和图表。
MM-RAG(Multimodal RAG)框架通过直接将文档图像嵌入到视觉语言模型(VLM)中来检索和生成信息,从而绕过了传统的文本解析阶段。它能够理解图片内容及其与文本的关系,适用于包含大量图表、公式或复杂排版的文档处理场景。
特点:突破了纯文本限制,增强了非结构化数据的处理能力。
4. Graph RAG 框架
Graph RAG(图检索增强生成)引入了知识图谱的概念。其优势在于可以回答涉及整个外部知识库的问题并得出结论,能够捕捉实体间的关系,支持复杂的推理任务。
挑战:最大的问题在于落地难度大,构建高质量的知识图谱成本高,且维护复杂。
特点:适合需要全局理解和逻辑推理的场景,如金融风控、医疗诊断辅助。
5. Hybrid RAG 框架
Hybrid RAG(混合 RAG)结合了多种检索技术,可能包括文本检索、向量检索和图检索,旨在提高检索的准确性和效率。它不依赖单一的数据表示方式,而是根据查询类型动态选择或融合不同来源的信息。


