大模型面试核心知识点与实战问答总结
本文针对算法岗技术趋势、大模型落地项目经验、新手入门及面试常考点进行了系统梳理,涵盖 RAG 架构、模型微调、训练优化及推理加速等核心领域。
1. RAG 技术体系的总体思路
RAG(Retrieval-Augmented Generation)通过检索增强生成,将外部知识库与大语言模型结合。其标准流程如下:
- 数据预处理:清洗原始数据,去除噪声。
- 分块(Chunking):关键步骤,影响检索粒度与效果。
- 文本向量化:使用 Embedding 模型将文本转为向量。
- Query 向量化:将用户问题转为向量。
- 向量检索:在向量数据库中检索相似片段。
- 重排(Rerank):对检索结果进行精排序。
- 输入 LLM:将 Query 与检索内容拼接输入大模型。
- 输出:生成最终回答。
2. 使用外挂知识库主要为了解决什么问题
- 克服遗忘问题:LLM 训练数据截止后无法获取新知识。
- 提升准确性与权威性:基于事实性文档减少幻觉。
- 解决小众领域覆盖不足:通用模型缺乏垂直领域知识。
- 提高可控性与可解释性:引用来源明确,便于审计与安全管控。
3. 如何评价 RAG 项目效果的好坏
检索环节评估
- MMR(最大边际相关性):平衡相关性与多样性。
- Hits Rate(命中率):前 k 项中包含正确信息的比例。
- NDCG(归一化折损累计增益):考虑排序位置的评估指标。
生成环节评估
- 非量化指标:完整性、正确性、相关性。
- 量化指标:Rouge-L(重叠率)、BLEU 等。
4. 大模型的幻觉问题与复读机问题
- 幻觉问题:模型生成的内容看似合理但无意义或不忠实于源内容,属于事实性错误。
- 复读机问题:模型陷入循环,重复生成相同的短语或句子。
5. 针对幻觉与复读机的解决办法
- 针对幻觉:引入外挂知识库、加入纠偏规则(如约束输出格式)、限制输出长度、增加置信度阈值。
- 针对复读机:丰富数据集多样性、过滤重复文本、同义词替换做数据增强、调整温度参数(Temperature)、后处理去重。
6. 出现幻觉问题的原因
- 训练数据偏差:数据中存在错误或矛盾信息。
- 模型能力局限:注意力机制未能准确聚焦关键信息。
- 提示词设计不当:未明确约束模型行为。
- 上下文缺失:缺乏必要的背景知识导致模型猜测。
7. 当前主流的开源大模型及其架构
当前开源生态中影响力最广的是 Meta 的 LLaMA 系列。其基于 Transformer 架构,主要改进包括:


