大模型面试常见问题全解析
1. RAG 技术体系的总体思路
检索增强生成(Retrieval-Augmented Generation, RAG)的核心流程如下:
- 数据预处理:清洗原始数据,去除噪声。
- 分块(Chunking):这一步骤非常关键,直接决定了检索的粒度和模型效果。常见的策略包括固定长度分块、基于语义的分块等。
- 文本向量化:将文本块转换为向量表示。
- Query 向量化:将用户查询转换为向量。
- 向量检索:在向量数据库中查找最相似的 Top-K 文档。
- 重排(Rerank):使用更精细的模型对检索结果进行排序优化。
- 输入 LLM:将 Query 和检索到的内容拼接作为 Prompt 输入大语言模型。
- 输出:模型生成最终回答。
2. 使用外挂知识库主要为了解决什么问题
引入外部知识库主要为了克服纯参数化模型的局限性:
- 克服遗忘问题:解决模型训练后知识截止的问题。
- 提升准确性与权威性:确保回答基于事实而非幻觉。
- 覆盖小众领域:通用模型未充分训练的垂直领域知识。
- 提高可控性与可解释性:通过引用来源增加可信度,便于审计。
3. 如何评价 RAG 项目效果的好坏
针对检索环节的评估
- MMR (Maximal Marginal Relevance):衡量相关性和多样性。
- Hits Rate:前 K 项中包含正确信息的比例。
- NDCG (Normalized Discounted Cumulative Gain):考虑排名权重的评估指标。
针对生成环节的评估
- 非量化指标:完整性、正确性、相关性、流畅度。
- 量化指标:Rouge-L、BLEU 等自动评分工具。
4. 大模型的幻觉问题、复读机问题是什么
- 幻觉问题:模型生成的内容与事实不符,或者不忠实于提供的上下文信息,产生看似合理但错误的陈述。
- 复读机问题:模型在生成长文本时陷入循环,重复生成相同的短语或句子。
5. 针对幻觉和复读机问题的解决办法
针对幻觉问题
- 引入高质量的外挂知识库。
- 加入纠偏规则(如约束输出格式)。
- 限制输出长度,减少发散风险。
- 使用思维链(CoT)提示工程引导逻辑推理。
针对复读机问题
- 丰富数据集的多样性,预处理时过滤重复无意义的文本。
- 使用同义词替换等方法做数据增强。
- 调整温度参数(Temperature),增加随机性。
- 实施后处理与过滤机制,检测并终止重复序列。
6. 出现幻觉和复读机问题的原因分析
幻觉原因
主要分为两类:
- 生成结果与数据源不一致:训练数据与源数据未对齐,编码器理解能力缺陷,或解码器策略错误。


