AI 大模型面试核心知识点与参考答案
一、大模型基础
1. 目前主流的开源模型体系有哪些?
目前主流的开源大模型体系包括:
- Llama 系列:Meta 发布的 Llama、Llama2、Llama3,采用 Transformer Decoder-only 架构。
- ChatGLM 系列:智谱 AI 推出的 ChatGLM、ChatGLM2、ChatGLM3,支持中英双语。
- Qwen 系列:阿里云通义千问,如 Qwen、Qwen2、Qwen-Max 等。
- Baichuan 百川:百川智能推出的开源模型。
- Falcon:TII 发布的 Falcon 系列,强调推理效率。
- Mixtral:Mistral AI 推出的 MoE(混合专家)架构模型。
2. Prefix LM 和 Causal LM 区别是什么?
- Causal LM (因果语言模型):如 GPT 系列。只能看到当前 token 之前的信息,无法看到未来的 token。适用于文本生成任务。
- Prefix LM (前缀语言模型):允许模型在生成时访问部分上下文或特定前缀,常用于序列标注或特定结构的生成任务。
3. 涌现能力是啥原因?
涌现能力(Emergent Abilities)指随着模型规模增大而突然出现的、小模型不具备的能力(如推理、多步规划)。原因通常认为是参数量和数据量达到临界点后,模型内部表示空间足够复杂,能够自发形成处理复杂任务的机制。
4. 大模型 LLM 的架构介绍?
主流架构基于 Transformer,主要包含:
- Embedding Layer:词向量映射。
- Transformer Blocks:由 Self-Attention 和 Feed-Forward Network (FFN) 组成。
- Normalization:LayerNorm 或 RMSNorm。
- Output Head:线性层 + Softmax 预测下一个 token。
二、大模型进阶
1. Llama 输入句子长度理论上可以无限长吗?
不可以。受限于位置编码(Positional Encoding)的范围和显存限制。虽然可以通过插值(如 YaRN)或 RoPE 扩展上下文窗口,但理论上限仍受硬件和算法约束。
2. 什么是 LLMs 复读机问题?
指模型在生成长文本时陷入循环,重复输出相同的短语或句子。这通常是由于概率分布过于集中或解码策略不当导致。
3. 为什么会出现 LLMs 复读机问题?
- 温度参数过低:导致输出确定性过高。
- 惩罚机制缺失:未对重复 token 进行惩罚。
- 训练数据偏差:训练语料中存在大量重复模式。
4. 如何缓解 LLMs 复读机问题?
- 调整
repetition_penalty参数。 - 使用 Top-K 或 Top-P 采样策略。
- 增加最大生成长度限制。
5. 什么情况用 Bert 模型,什么情况用 LLaMA、ChatGLM 类大模型?
- BERT:适合理解类任务(分类、抽取),双向上下文,参数量较小。


