RAG 提升大语言模型能力的三大关键技术

三大关键技术看 RAG 如何提升 LLM 的能力

大语言模型表现出色，但是在处理幻觉、使用过时的知识、进行不透明推理等方面存在挑战。检索增强生成（RAG）作为一个新兴的解决方案，通过整合外部知识库的数据，提高了模型在知识密集型任务中的准确性和可信度，能够实现知识持续更新和特定领域信息的集成，有效将 LLM 的内在知识与外部数据的巨大动态资源相结合。

本文主要是对综述论文《Retrieval-Augmented Generation for Large Language Models: A Survey》的概括和解读，同时也会整合一些其他来源的材料。后面主要探讨 RAG 范式（包括 Naive RAG、Advanced RAG、Modular RAG）的发展，同时会详细介绍 RAG 的三大关键技术（检索、生成、增强），然后会介绍 RAG 的评估指标及应用实践。

大模型应用面临的挑战

大语言模型（如 GPT 系列、LLama 系列、文心一言等），已经在自然语言领域的多项基准测试中取得突破性进展。然而，它们在处理特定领域或者一些高度专业化的场景时存在一些局限性。

内容不真实：幻觉问题/领域知识匮乏
时效性不强
隐私&安全性

为了应对这些挑战，主要有以下几种类型的解决方案：

参数化的方式：通过微调的手段将领域知识嵌入模型，更新模型参数。它的缺点是训练成本较高、灵活性较差；优势在于能够输出高质量的结果。
非参数化方式：通过数据库存储相关的知识，检索后直接使用。它的优势在于成本低、灵活性强、可解释性高；缺点在于少了生成的过程，检索出的内容可能不能直接回答问题，有较高的理解成本。
用非参数化的语料库与参数化的模型集成，也就是 RAG，同时具备参数化方式和非参数化方式的优点。

什么是 RAG

顾名思义，RAG (Retrieval-Augmented Generation), 主要包括 3 个关键过程（Retrieval、Augmentation 和 Generation），它主要通过从外部知识库中'检索'最新信息作为外挂来'增强'LLM'生成'答案的效果。在回答问题或生成文本之前查询外部数据源并合成一个内容更加丰富的 Prompt，从而显著提升输出的准确性和相关性。目前，RAG 已经成为 LLM 系统中最流行的架构之一，因其高实用性和低门槛的特点，许多对话产品都是基于 RAG 进行构建。

RAG 框架结构

从简单到复杂可以分为三个层次的 RAG，包括 Naive RAG、Advanced RAG、Modular RAG。

从 Naive RAG 说起

最基本的 RAG 方式，分为 Indexing、Retrieval、Generation 这 3 个步骤，简单而实用。

Naive RAG 的一些局限性

Naive RAG 的效果在检索质量、结果生成质量和增强的过程方面都存在一定的挑战。

检索质量方面

准确率低，可能会导致幻觉
召回率低，导致信息不完整
过时或者冗余的信息导致检索结果不准确

结果生成质量方面

幻觉问题，如果问题的答案未能被正确检索，生成的结果仍然会产生幻觉
答非所问，问题和答案未能正确匹配
生成有害和偏见的答案

增强过程（整合来自检索的内容）的挑战

内容不连贯/脱节
冗余和重复
确定每段内容对于结果生成的重要性
协调来自不同写作风格/语气的内容差异，从而保证输出一致性
生成结果可能过渡依赖增强信息，导致和增强信息相比没有带来额外的收益

Advanced RAG 如何应对这些挑战

和 Naive RAG 相比，Advanced RAG 加入了 Pre-Retrieval 和 Post-Retrieval 模块，同时对 Retrieval 模块也进行了一些优化，从而改进输出效果。

Pre-Retrieval

可以通过优化数据索引的方式来改进 Pre-Retrieval 阶段的质量。大致有 5 种策略可以使用：

增强数据粒度：主要是对数据内容进行修订和简化，确保数据源的正确性和可读性。预索引优化的主要目的是提升文本的规范化、统一性，并确保信息的准确无误和上下文的充分性，以此来保障 RAG 系统的表现。具体的方式包括删除不相关信息、消除实体种的歧义和术语、确认事实准确性、维护上下文、更新过时文件。

RAG 提升大语言模型能力的三大关键技术

三大关键技术看 RAG 如何提升 LLM 的能力

大模型应用面临的挑战

什么是 RAG

RAG 框架结构

从 Naive RAG 说起

Naive RAG 的一些局限性

Advanced RAG 如何应对这些挑战

Pre-Retrieval

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

Retrieval

Post-Retrieval

Modular RAG

新模块

新模式

优化 RAG 的 pipeline

Retriever 模块

如何得到准确的语义表征？

如何匹配 query 和文档的语义空间？

如何对齐检索结果和大模型的输出偏好

Generator 模块

如何通过 Post-retrieval 过程增强检索结果

Fine-tuning LLM for RAG

Augmentation 模块

在哪些阶段进行增强？

预训练阶段

Fine-tuning 阶段

推理阶段

增强数据源

非结构化数据的增强

结构化数据的增强

在 RAG 中利用 LLMs 生成的内容

增强过程

迭代检索

递归检索

自适应检索

RAG 和 Fine-Tuning 的对比

RAG 效果评估

评估对象

Evaluation Aspects

Quality Scores

需要的能力

评估的 Benchmarks 和工具

展望

RAG 面临的挑战

RAG 的模态扩展

RAG 的生态

下游任务和评估

技术栈

业界实践

百川智能的 RAG 方案

OpenAI 案例

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具