2024 AI 大模型面试常见问题与答案解析
1. 基础知识
问题:请简要介绍目前主流的大模型体系有哪些?
答案: 目前主流的大模型体系主要包括以下几类,均基于 Transformer 架构或其变体:
- GPT 系列:由 OpenAI 发布,基于自回归(Autoregressive)的 Transformer 架构。包括 GPT-1、GPT-2、GPT-3 及 ChatGPT 等。这些模型具有强大的文本生成能力和语言理解能力,广泛应用于对话系统和内容创作。
- BERT:由 Google 发布,基于双向 Transformer 编码器(Encoder-only)。BERT 在多个自然语言处理任务上取得了显著效果,如文本分类、命名实体识别和问答系统。
- XLNet:由 CMU 和 Google Brain 发布,结合了自回归和自编码的优势。通过置换语言建模目标,能够建模全局依赖关系,解决了 BERT 中掩码导致的独立性假设问题。
- RoBERTa:由 Meta(原 Facebook)发布,是对 BERT 的改进版本。通过移除下一句预测任务、使用更大规模数据和更长训练时间,取得了更好的性能表现。
- T5:由 Google 发布,一种基于 Encoder-Decoder 架构的多任务预训练语言模型。T5 将所有 NLP 任务统一为'文本到文本'的形式,支持翻译、摘要、分类等多种任务。
- LLaMA 系列:由 Meta 开源,专注于高效训练和推理,推动了开源大模型的发展。
问题:Transformer 架构的核心组件是什么?
答案: Transformer 架构的核心组件包括:
- Self-Attention(自注意力机制):允许模型在处理序列时关注输入的不同部分,捕捉长距离依赖关系。
- Multi-Head Attention(多头注意力):并行运行多个注意力头,使模型能从不同子空间学习信息。
- Positional Encoding(位置编码):由于 Transformer 不处理序列顺序,需添加位置编码以注入序列信息。
- Feed-Forward Networks(前馈神经网络):对每个位置的表示进行非线性变换。
- Layer Normalization & Residual Connections:稳定训练过程并缓解梯度消失问题。
2. 训练过程
问题:大型语言模型(LLM)通常如何进行训练?
答案: 大型语言模型的训练通常分为两个主要阶段:
- 预训练(Pre-training):模型接触到来自互联网、书籍等多来源的大量无标注文本数据。目标是学习语言的通用表示,包括语法、事实知识和推理能力。此阶段计算成本极高,通常需要数千张 GPU 进行数周训练。
- 微调(Fine-tuning):为了提高特定任务的性能,在预训练模型的基础上,使用特定领域的有标注数据进行再训练。常见的微调方式包括全参数微调和参数高效微调(PEFT)。
问题:什么是 RLHF?它在 LLM 训练中起什么作用?
答案: RLHF(Reinforcement Learning from Human Feedback,基于人类反馈的强化学习)是一种用于对齐大模型输出与人类价值观的技术流程。它包含三个步骤:
- 监督微调(SFT):使用高质量的人类指令数据对模型进行微调。
- 奖励模型训练(Reward Modeling):训练一个模型来评估不同输出的质量,模拟人类的偏好。
- 强化学习优化(PPO):使用奖励模型作为信号,通过策略梯度方法优化主模型,使其生成更符合人类期望的回答。


