10 个大型语言模型 (LLM) 核心面试题与解析
本文总结了大型语言模型面试中常问的 10 个核心问题及其详细解析,涵盖从基础概念到工程实践的关键知识点。
1. 哪种技术有助于减轻基于提示的学习中的偏见?
选项: A. 微调 Fine-tuning B. 数据增强 Data augmentation C. 提示校准 Prompt calibration D. 梯度裁剪 Gradient clipping
答案:C
解析: 提示校准(Prompt Calibration)包括调整提示词的结构和内容,尽量减少产生的输出中的偏差。通过设计更中立或引导性的提示,可以抑制模型在生成时表现出的特定偏见。
- 微调修改的是模型本身的权重参数,虽然也能影响行为,但成本较高。
- 数据增强扩展训练数据,主要用于提升泛化能力。
- 梯度裁剪用于防止训练期间梯度爆炸,属于优化技巧。

2. 是否需要为所有基于文本的 LLM 用例提供矢量存储?
答案:不需要
解析: 向量存储用于存储单词或句子的向量表示,捕获语义信息,常用于检索增强生成(RAG)。并非所有基于文本的 LLM 用例都需要矢量存储。
- 情感分析:通常基于文本本身的情感倾向判断,不需要额外上下文。
- 翻译任务:上下文通常由句子本身和所属文档提供,无需单独向量库支持。

3. 以下哪一项不是专门用于将大型语言模型 (LLM) 与人类价值观和偏好对齐的技术?
选项: A. RLHF B. Direct Preference Optimization C. Data Augmentation
答案:C
解析:
- RLHF (Reinforcement Learning from Human Feedback):利用人类反馈改进奖励函数,引导模型产生符合人类偏好的输出。
- DPO (Direct Preference Optimization):直接基于人类偏好比较不同输出以指导学习,是 RLHF 的一种替代方案。
- 数据增强:是一种通用的机器学习技术,通过修改现有数据扩展训练集,虽间接影响一致性,但非专为价值观对齐设计。









