近年来,随着大语言模型(LLM)的广泛应用,检索增强生成(Retrieval-Augmented Generation,RAG)系统逐渐成为连接私有知识库与智能问答的核心架构。RAG 不仅弥补了大模型在实时性与事实性上的不足,也通过多种技术路径不断演进,形成了丰富的方法体系。

本文基于一份内部技术评估表,系统梳理了当前主流的 RAG 技术路线,并对其核心思路、实现难度与应用场景进行解读,覆盖从基础到进阶的全维度方案,为不同场景下的 RAG 系统选型提供参考。
一、基础分块与语义优化
该类方案聚焦于「文档切分」与「基础语义检索」,是 RAG 落地的入门级路径,核心解决'如何把文档拆成可检索单元'的问题。
1. Simple RAG(简单切块)
核心思路:将文档按固定长度切分为多个 chunk(片段),直接基于原始文本/基础向量进行检索。切分策略包括:按固定字数切块(如每 500 字一个 chunk)、按分句切块(按句号/换行符分割)、按分段切块(保留文档原生段落结构)。 实现难度:⭐(极低) 优点:开发成本低、部署快,无需复杂语义分析,适合小规模知识库(如单品类文档)或项目初期验证效果。 局限:机械切分易割裂语义(如跨 chunk 的长句、核心观点被拆分),导致检索上下文丢失;对长文档、跨段落关联的问题适配性差。 典型应用场景:小型企业内部 FAQ 问答、单类型短文档检索(如产品说明书)。
示例: 回答用户的问题:'北京有什么著名的景点?'
- 原始文档:《中国旅游手册》中'北京著名景点'章节被按 300 字切块,其中一个 chunk 包含'故宫、长城、颐和园是北京的核心文旅地标,每年接待超亿人次游客';
- 检索过程:直接匹配'北京''著名景点'关键词,返回该 chunk;
- 生成结果:基于该 chunk 总结出'北京的著名景点包括故宫、长城、颐和园等,是核心文旅地标'。
2. Semantic Chunking(语义感知切块)
核心思路:突破固定长度限制,基于自然语言的语义边界切分文档。核心方法包括:利用句法分析识别句子/段落的语义完整度(如基于 spaCy、HanLP 解析主谓宾结构)、基于文档结构(标题层级、目录)划分逻辑单元、结合领域词典(如法律/医疗术语)保留专业概念的完整性。 实现难度:⭐⭐(低) 优点:避免语义割裂,检索到的 chunk 具备完整逻辑,提升回答的准确性;适配长文档和专业领域文档。 局限:需适配不同语言/领域的语义模型,切分规则需手动调优;对无结构化文档(如纯文本聊天记录)效果有限。 典型应用场景:企业知识库(含多层级文档)、专业领域短文档(如医疗指南、法律条文)。
3. Chunk Overlap(重叠切块)
核心思路:在 Simple RAG 基础上,为相邻 chunk 设置重叠区域(如每 500 字切块,重叠 50 字),弥补固定切分的语义断裂问题。重叠内容通常为前一个 chunk 的末尾部分、后一个 chunk 的开头部分。 :⭐(极低) :几乎无额外开发成本,仅需调整切分参数;有效解决'核心信息跨 chunk'的问题(如'某产品的安装步骤 3-5 跨两个 chunk')。 :会增加检索冗余度(重叠内容可能被重复检索);重叠长度需手动调试(过长增加计算量,过短无效果)。 :需要保留连续逻辑的文档(如操作手册、步骤说明),是 Simple RAG 的'低成本优化版'。


