大模型面试题库：100 道经典问题解析

大模型领域的 100 道经典面试问题，涵盖基础架构、训练微调、推理优化及应用场景。内容涉及 Transformer 原理、LoRA 微调、RAG 技术、量化方法及 RLHF 流程等核心技术点，并提供简要解析。适用于准备 AI 算法工程师及大模型应用开发岗位的求职者参考复习。

GopherDev发布于 2025/2/7更新于 2026/4/210 浏览

1. 你了解 ReAct 吗，它有什么优点？ ReAct (Reasoning + Acting) 是一种将推理（Reasoning）与行动（Acting）结合的策略。其优点在于能够利用外部工具解决复杂任务，通过思维链展示推理过程，提高模型的可解释性和任务完成度。

2. 解释一下 LangChain Agent 的概念 LangChain Agent 是指利用 LLM 作为控制器，根据用户输入决定调用哪些工具（Tools）并执行相应操作，最终生成响应的智能体系统。

3. LangChain 有哪些替代方案？ 主要替代方案包括 LlamaIndex、Semantic Kernel、Haystack 以及各云厂商提供的原生 AI 开发框架。

4. LangChain Token 计数有什么问题？如何解决？ Token 计数在不同模型间存在差异，可能导致成本估算不准。解决方案是使用特定模型的官方分词器进行精确计数，而非依赖通用估算。

5. LLM 预训练阶段有哪几个关键步骤？ 关键步骤包括数据清洗与构建、分词器训练、模型架构设计、分布式训练优化及评估验证。

6. RLHF 模型为什么会表现比 SFT 更好？ RLHF（基于人类反馈的强化学习）引入了人类偏好奖励模型，使模型输出更符合人类价值观和指令意图，而 SFT 仅模仿数据分布。

7. 参数高效的微调（PEFT）有哪些方法？ 常见方法包括 LoRA、QLoRA、Prefix Tuning、P-Tuning、Adapter Tuning 等。

8. LORA 微调相比于微调适配器或前缀微调有什么优势？ LoRA 通过低秩分解更新权重，参数量更小，显存占用更低，且无需修改原始模型结构，部署更灵活。

9. 你了解过什么是稀疏微调吗？ 稀疏微调指在训练过程中仅更新部分参数（如激活值较高的神经元），以减少计算量和存储需求。

10. 训练后量化（PTQ）和量化感知训练（QAT）有什么区别？ PTQ 是在训练完成后直接量化，速度快但精度损失可能较大；QAT 在训练过程中模拟量化误差，精度更高但耗时更长。

11. LLMs 中，量化权重和量化激活的区别是什么？ 量化权重是压缩模型参数，减少存储；量化激活是压缩中间计算结果，减少显存带宽压力，两者常结合使用。

12. AWQ 量化的步骤是什么？ AWQ (Activation-aware Weight Quantization) 通过识别对量化敏感的权重通道，保留重要权重的精度，再进行低比特量化。

13. 介绍一下 GPipe 推理框架 GPipe 是一种用于大规模模型训练的流水线并行框架，将模型层切分分配给不同设备，减少通信开销。

14. 矩阵乘法如何做数量并行？ 通常采用张量并行（Tensor Parallelism），将矩阵乘法运算切分到多个 GPU 上协同计算。

15. 请简述 TPPO 算法流程，它跟 TRPO 的区别是什么？ TPPO (Trust Region Policy Optimization) 是 PPO 的变体，强调信任区域约束。TRPO 使用复杂的二阶优化，TPPO/PPO 使用一阶近似，效率更高。

16. 什么是检索增强生成（RAG）？ RAG 通过从外部知识库检索相关信息，将其作为上下文输入给 LLM，以补充模型知识并减少幻觉。

17. 目前主流的中文向量模型有哪些？ 主流包括 BGE-M3、M3E、text2vec 等，支持多语言及长文本嵌入。

18. 为什么 LLM 的知识更新很困难？ 预训练数据固定，模型参数固化。更新需重新训练或微调，成本高且易产生灾难性遗忘。

19. RAG 和微调的区别是什么？ RAG 通过检索外部数据动态增强，不改变模型参数；微调通过更新参数内化知识，适合领域适配。

20. 大模型一般评测方法及其准是什么？ 常用 MMLU、C-Eval、GSM8K 等基准测试，指标包括准确率、BLEU、ROUGE 及人工评估。

21. 什么是 KV Cache 技术，它具体是如何实现的？ KV Cache 缓存自注意力机制中的 Key 和 Value 矩阵，避免重复计算，显著降低推理延迟。

22. DeepSpeed 推理对算子融合做了哪些优化？ DeepSpeed 合并了多个算子（如 LayerNorm+Attention），减少内核启动次数和显存访问。

更多推荐文章