国内大模型企业面试复盘与经验总结
2023 年三月前后,大模型在国内迅速兴起,笔者在此期间面了多家大厂及初创公司。近期多位同行朋友对大模型岗位面试感兴趣,特将经历综合整理如下,希望能与各位交流。由于时间跨度较长(最早面试距今已半年),部分细节记忆可能模糊,列表顺序大致按面试时间排列。
后文会总结面试经验感悟及建议注重的内容,一家之言仅供参考。
一、面试经历概览
1. 智元机器人(Agibot)
当时处于早期组建团队阶段,一面由创始人稚晖君亲自面试。主要询问简历经历及 Transformer 相关基础问题,如 MHA 机制、复杂度分析、BERT/GPT 架构差异等。后续未收到回复,判定为未通过。与大牛交流体验顺畅,看好具身智能方向。
2. 面壁科技/面壁智能
共两面。技术面涉及大模型训练、Transformer 细节及过往项目经历;二面直接沟通 Offer 事宜。团队年轻,清华背景居多。资金充足,薪资包具有竞争力。
3. 光年之外
猎头推荐,简历筛选阶段被拒。
4. 北京智源人工智能研究院
共 3-4 轮面试,面试官来自不同团队(Evaluation、训练等)。整体感觉偏向招募 Evaluation 方向人才。中途有一次面试官爽约,后续 HR 未再跟进,默认为拒。
5. 360
猎头沟通时定位为高 P(P8+),最终简历被拒。
6. Minimax
面试轮次较多(至少 4+ 轮)。前几轮侧重 LeetCode,大模型内容问得较浅,其中一面要求手写 MHA。最后一轮主管面后分配至框架组 Offer,咨询算法组机会被否。薪资总包较高,但业务方向沟通较少。
7. 昆仑万维
面试涉及大模型训练细节,如参数量级、训练技巧等,未见 LeetCode。面试官氛围轻松。Offer 薪资相对其他家略低,但猎头反馈其整体待遇不错。
8. 云从科技
两轮面试被拒。第二轮面试时长异常(设定 1 小时,实际聊 2 小时),深入探讨了模型端、框架端及研究细节。虽交流愉快,但未通过。
9. 阿里夸克
共 4 轮。含 2 轮 LeetCode,穿插大模型经验问答。第三轮为标准大模型问题(Transformer、分布式训练、Loss Spike 处理等)。第四轮交叉面试,涉及搜广推概率论及 OS 问题。Offer 流程中 HR 沟通体验一般。
10. 衔远
约 3 面,问题中规中矩。终面与周伯文老师交流。提供框架岗位,个人意向为模型岗,薪资较高。
11. 潞晨科技(Colossal-AI)
主打框架,一面深挖模型切分方式及 Flash Attention 等内容。表达想做算法端后,二面转算法组,侧重应用端,因基座方向 HC 有限未通过。框架端在圈内口碑较好。
12. 蚂蚁集团
徐鹏老师团队。二面由徐鹏老师本人面试,涵盖大模型、搜广推及实习经历。团队强调 Research 与 Engineering 不分家,观点契合。HR 面后快速发 Offer,首年签字费可观。
13. 腾讯
猎头反馈需 PhD 学历,简历被拒。
14. 小红书
猎头反馈需 PhD 学历,简历被拒。
15. 商汤科技
共两面。一面含 LeetCode 及手写 MHA,表现尚可。二面回答不佳,具体遗忘。后续无消息,判定为拒。
16. 百川智能
猎头安排面试,一面通过后,二面因迟到被 HR 以经验年限不足为由拒绝。
17. 百度文心
多轮面试。一面数据组,侧重数据处理;申请转模型组后,二面起由模型组负责。内容涵盖 Transformer 及训练细节,分组细致(模型、框架、数据分离)。薪资底薪较高。
18. 科大讯飞
HR 初筛因工作地点(合肥)原因直接拒绝。
19. IDEA 研究院
一面即被拒,印象不深。
20. 好未来
团队背景相对一般。一面 LeetCode 未答出,模型轮表现尚可获 Offer。项目涉及数学相关 GPT 模型。


