AI 产品经理 RAG 面试知识点汇总
1. RAG 概述与核心价值
1.1 什么是 RAG
RAG(Retrieval Augmented Generation,检索增强生成)是一种构建 AI 应用的方法。其核心思想是将外部知识库与大语言模型(LLM)相结合,让大模型根据检索到的相关知识片段进行回答,而不是仅依赖模型训练时的内部参数知识。
1.2 RAG 与直接 Prompt 的区别
- 直接 Prompt:用户上传文档,大模型直接读取全文。受限于 Token 长度和上下文窗口。
- RAG 流程:
- 将知识库内容向量化并存储。
- 接收用户问题,转换为向量。
- 在向量数据库中检索最相关的知识片段。
- 将检索结果作为上下文输入给大模型生成回答。
1.3 RAG 的三大价值
- 控制回答范围:引导大模型基于特定数据回答,减少幻觉。
- 补充专业知识:弥补大模型在垂直领域知识的不足,使其成为行业专家。
- 突破 Token 限制:支持处理远超上下文窗口的大型知识库,实现动态知识更新。
2. RAG 技术架构详解
2.1 基础组件
- Embedding 模型:负责将文本转换为高维向量,用于相似度计算。需关注多语言支持及语义理解能力。
- 向量数据库:存储向量索引,支持高效检索(如 Milvus, Pinecone, Elasticsearch)。
- 大语言模型:负责根据检索内容和用户指令生成最终回复。
2.2 核心流程
- 数据入库(Ingestion):
- 文档解析(PDF, Word, Markdown 等)。
- 文本清洗与预处理。
- 分块(Chunking)策略选择。
- 向量化处理。
- 查询处理(Query Processing):
- 意图识别与查询改写。
- 向量检索或混合检索。
- 生成阶段(Generation):
- 构建 Prompt 模板。
- 调用 LLM 生成答案。
- 引用来源标注。
3. 关键技术点与优化策略
3.1 文档切分(Chunking)
切分粒度直接影响检索质量与生成效果。
- 固定字符数切分:简单但可能破坏语义完整性。
- 语义切分:按段落、标题或句子边界切分,保持逻辑完整。
- 递归切分:先按大结构切分,再对大块进行细分,保留层级关系。
- 重叠策略:设置块间重叠(Overlap),避免关键信息被切断。
3.2 检索增强
- 稠密检索(Dense Retrieval):基于向量相似度,适合语义匹配。
- 稀疏检索(Sparse Retrieval):基于关键词(BM25),适合专有名词匹配。
- 混合检索(Hybrid Search):结合两者优势,加权融合得分。


