大模型面试题全集：基础、微调、RAG、推理及更多

大模型面试题全集

一、大模型基础

目前主流的开源模型体系有哪些？
Prefix Decoder、Causal Decoder 和 Encoder-Decoder 有何区别？
大模型 LLM 的训练目标是什么？
涌现能力出现的原因？
为何现在的大模型大多是 Decoder-only 结构？
请简要介绍大模型（LLMs）。
大模型后面跟的 175B、60B、540B 等数字代表什么？
大模型有哪些优点？
大模型有哪些缺点？
Encoder-only、Decoder-only、Encoder-Decoder 架构的区别？
BART、Llama、GPT、T5、Palm 等主流模型的异同点？
Prefix LM 与 Causal LM 的区别？

层归一化方法

写出 Layer Norm 的计算公式。
写出 RMS Norm 的计算公式。
RMS Norm 相比 Layer Norm 有什么特点？
Deep Norm 的思路？
写出 Deep Norm 的代码实现。
Deep Norm 的优点？

层归一化位置

LN 在 LLMs 中放置在哪些位置，有何区别？

层归一化对比

各 LLMs 模型分别用了哪种层归一化？

FFN 块与激活函数

FFN 块的计算公式是什么？
GeLU 的计算公式？
Swish 的计算公式？
使用 GLU 线性门控单元的 FFN 块计算公式？
使用 GeLU 的 GLU 块计算公式？
使用 Swish 的 GLU 块计算公式？
各 LLMs 使用哪种激活函数？
Adam 优化器与 SGD 的区别？

Attention 机制

传统 Attention 存在哪些问题？
Attention 的优化方向有哪些？
Attention 的变体有哪些？
Multi-Query Attention
- Multi-head Attention 存在什么问题？
- 什么是 Multi-Query Attention？
- 对比 MHA 与 Multi-Query Attention？
- Multi-Query Attention 的好处是什么？
- 哪些模型使用了 Multi-Query Attention？
Grouped-query Attention
- 什么是 Grouped-query Attention？
- 哪些大模型使用了 Grouped-query Attention？
FlashAttention
- 为什么需要 FlashAttention？
- 简要介绍 FlashAttention。
- FlashAttention 的核心是什么？
- FlashAttention 的优点有哪些？
- 使用 FlashAttention 的代表模型？
并行
Attention 的计算复杂度及改进方法？
Paged Attention
- 简要介绍 Paged Attention。
对比 MHA、GQA、MQA 三种注意力机制？区别是什么？

Cross Attention

为什么需要跨注意力机制（Cross-Attention）？
介绍跨注意力机制（Cross-Attention）。

大模型面试题全集：基础、微调、RAG、推理及更多

大模型面试题全集

一、大模型基础

层归一化方法

层归一化位置

层归一化对比

FFN 块与激活函数

Attention 机制

Cross Attention

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

BERT 相关

损失函数与相似度

相似度与对比学习

生成式与大模型特性

二、大模型微调

SFT 开发流程

训练策略

三、LangChain

Agent 上下文

四、RAG 检索增强生成

RAG 入门

RAG 模块详解

RAG 版面分析

表格识别

文本分块

RAG 检索策略

负难样本

RAG 评测

RAG 优化策略

RAG 常见问题

RAG-Fusion

Graph RAG

五、参数高效微调 (PEFT)

Adapter-tuning

Prompting

LoRA 篇

LoRA 变体

LoRA 配置与优化

微调方案选择

六、大模型推理

推理过程与指标

七、增量预训练

拼接策略

Llama2 二次预训练

模型评测

八、强化学习

RLHF Pipeline

PPO 与 DPO

DPO

Reward Model

强化学习基础

九、训练数据

数据集生成

十、显存问题

显存优化

十一、分布式训练

理论篇

实践篇

并行技术细节

DeepSpeed 与 Accelerate

数据并行 Trick

分布式训练问题

十二、Agent

函数调用 Function Call

位置编码

十三、Tokenizer

中文 Tokenization

继续预训练

指令微调

十四、大模型加速

推理过程与指标

推理框架

vLLM 与 PagedAttention

FasterTransformer

LightLLM

StreamingLLM

十五、大模型幻觉

幻觉问题