大模型技术热门面试题精选及解答指南
1. RAG 技术体系的总体思路
RAG(Retrieval-Augmented Generation)的核心流程如下:
- 数据预处理:清洗原始数据,去除噪声。
- 分块(Chunking):将文本切分为合适大小的片段,这一步对检索效果至关重要。
- 文本向量化:使用 Embedding 模型将文本片段转换为向量。
- Query 向量化:将用户查询转换为向量。
- 向量检索:在向量数据库中搜索最相似的 Top-K 片段。
- 重排(Rerank):利用交叉编码器对检索结果进行精细排序。
- 生成:将 Query 与检索内容拼接输入 LLM,生成最终回答。
2. 使用外挂知识库主要为了解决什么问题
- 克服遗忘问题:LLM 训练数据截止后无法获取新知识,外挂知识库可补充最新信息。
- 提升准确性与权威性:基于特定领域文档回答,减少幻觉。
- 解决小众领域覆盖不足:通用模型未训练的垂直领域知识可通过知识库注入。
- 提高可控性与可解释性:回答来源可追溯至具体文档片段,增强安全性。
3. 如何评价 RAG 项目效果的好坏
检索环节评估
- MMR (Maximal Marginal Relevance):平衡相关性与多样性。
- Hits Rate@K:前 K 项中包含正确答案的比例。
- NDCG (Normalized Discounted Cumulative Gain):衡量排序质量。
生成环节评估
- 非量化指标:完整性、正确性、相关性、流畅度。
- 量化指标:Rouge-L, BLEU, BERTScore。
4. 大模型的幻觉问题、复读机问题是什么
- 幻觉问题:模型生成的内容与事实不符或无中生有,不忠实于上下文。
- 复读机问题:模型在生成长文本时陷入循环,重复输出相同的短语或句子。
5. 针对问题 4,有没有什么解决办法
幻觉问题对策
- 引入外挂知识库约束生成范围。
- 加入系统提示词(System Prompt)纠偏规则。
- 限制输出长度,强制引用源文。
复读机问题对策
- 丰富数据集多样性,过滤重复文本。
- 同义词替换等数据增强手段。
- 调整 Temperature 参数增加随机性。
- 后处理检测并截断重复序列。
6. 出现问题 4 的原因有哪些
- 幻觉原因:
- 训练数据与源数据不一致或未对齐。
- 编码器理解能力缺陷或解码器策略错误。
- 用户问题超出模型认知范围。
- 复读机原因:
- 数据质量低,存在大量单一重复文本。
- 条件文本过长导致后续预测被淹没,Greedy Search 下概率最大 token 持续重复。


