国内大模型公司面试经验总结与技术要点分析

2023 年三月前后，大模型在国内突然火了起来。楼主面了一些公司，有大厂也有初创。最近挺多朋友聊大模型相关的内容，对面试也感兴趣，想这里综合写一下，也希望能和各位同行交流下。因为有一段时间了（最早面的半年了），所以大部分细节记不清，列表顺序大概按面试时间排的。后边会大体总结下面试的经验感悟，以及我认为要注重的内容，一家之言仅供参考。

一、面试经历概览

智元机器人 (Agibot) [拒]
- 稚晖君所在团队。当时面的很早，他们好像还在一边组建团队一边搞东西。
- 一面就是稚晖君本人，问了一些简历的经历，然后问了相关的比较常见的问题比如复杂度等。
- 印象还比较深刻。和大佬交流感觉也挺顺畅，很看好他家的以及具身智能这个方向。
面壁智能 [Offer]
- 记得一共两面，技术上问了大模型训练、Transformer 相关的内容和过往经历。
- 第二面好像就聊 Offer 了。团队很年轻，大部分清华背景。
- 当时感觉是不是有点太年轻了虽然清华背景这样子。印象里他们有说还是很足的。PS：包是挺大的。
[某公司] [简历拒]
- 三月份猎头帮忙推荐的，简历拒。
北京智源人工智能研究院 [未收到回复]
- 一共 3-4 面，面试官是不同 team 的人，有训练等团队。
- 面试时总体感觉他们想招偏 evaluation 这边的人。
- 面到后面记得有一次面试官鸽了约好的面试，然后后面说从新安排时间，但是猎头或者 HR 就没有再给后续消息了，应该是默拒了。
360 [简历拒]
- 当时猎头说要高 P，P8+。
Minimax [口头 Offer]
- 这家面试轮次挺多，具体记不清但是起码 4+ 轮。
- 前几轮都是考为主，问了很少很浅的大模型的内容，记得是其中一面是让手写 MHA。
- 最后一轮和主管聊完之后被分配到了框架组的 Offer，和猎头问了一下算法组是不是考虑，回答是不，就没再继续接触。
- PS：他家的包还是挺大的（总包说肯定到得了 100+），在几家初创里都算大的，但是面试时公司的前景，业务技术方向感觉面试官没有沟通很多。主管面也是 20 分钟就匆匆结束了，没有交流很多信息。
[某公司] [Offer]
- 面试好像问了之前训练大模型的内容，比如模型参数大小，训练一些细节之类的，印象里没有 LeetCode。
- 面试官记得很乐呵的一个人。当时拿到的包裹相对低一些（65 总包）比其他公司。
- 不过后边接触到猎头都说他家给的还是很可以的，所以不确定是不是自己记错了或者交流有误。
[某公司] [拒]
- 两轮面试被拒掉了，印象很深的是第二轮面试超级长，设定 1 个小时面试聊了 2 个多小时。
- 面试官问了很多之前的经验，大模型训练的细节之类的，模型端，框架端，之前做的研究都聊到了。
- 感觉聊的是挺开心的，不过后边就被拒了。
[某公司] [Offer]
- 4 论面试，2 轮带 LeetCode，然后浅浅问了相关经验。
- 第三轮主要问了大模型的内容，比较标准的问题（Transformer，训练，分布式，如何处理训练一些问题比如 Loss Spike 啥的）。
- 第四轮是 Cross 面，推荐组的一个大佬，感觉是象征性面试，因为之前做过搜广推问了相关问题，问了 Probability 和脑筋急转弯，最后问一些 OS 的问题我不会。
- 几天后收到 Offer，和 HR 接触时感觉不太礼貌，交流有些摩擦。包裹差不多 70-80 之间的算上）。
衔远科技 [Offer]

国内大模型公司面试经验总结与技术要点分析

国内大模型公司面试经验总结与技术要点分析

一、面试经历概览

更多推荐文章

相关免费在线工具

二、面试感悟与行业观察

三、高频技术考点详解

1. 多头注意力机制 (Multi-Head Attention)

2. 框架相关内容

3. 主流大模型架构

4. 大模型训练实战

5. 数据预处理

6. Evaluation (评估)

7. 多模态和 RLHF

四、补充技术背景知识（备考参考）

1. Transformer 架构核心

2. 显存优化技术

3. 分布式训练策略

4. 推理加速

5. RLHF (Reinforcement Learning from Human Feedback)

五、求职建议

更多推荐文章

相关免费在线工具

国内大模型公司面试经验总结与技术要点分析

国内大模型公司面试经验总结与技术要点分析

一、面试经历概览

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、面试感悟与行业观察

三、高频技术考点详解

1. 多头注意力机制 (Multi-Head Attention)

2. 框架相关内容

3. 主流大模型架构

4. 大模型训练实战

5. 数据预处理

6. Evaluation (评估)

7. 多模态和 RLHF

四、补充技术背景知识（备考参考）

1. Transformer 架构核心

2. 显存优化技术

3. 分布式训练策略

4. 推理加速

5. RLHF (Reinforcement Learning from Human Feedback)

五、求职建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具