2023 年三月前后,大模型在国内迅速兴起,笔者面试了多家大厂及初创公司。近期整理经验,希望能与同行交流。因时间跨度较大,部分细节可能模糊,列表按面试时间排序。
面经
1. 智元机器人(Agibot)(拒)
稚晖君团队。一面由创始人本人进行,询问简历经历及 Transformer 相关问题(如 MHA、复杂度、BERT/GPT)。后续无回复,判定为挂。印象较深,看好具身智能方向。
2. 面壁科技/面壁智能(offer)
共两面。技术面涉及大模型训练、Transformer 及过往经历;二面聊 Offer。团队年轻,清华背景居多,Funding 充足。薪资较高。
3. 光年之外(简历拒)
猎头推荐,简历阶段被拒。
4. 北京智源人工智能研究院(消失)
共 3-4 面,面试官来自不同团队(Evaluation、训练等)。感觉偏向招 Evaluation 方向人员。中途面试官爽约后未再安排,默拒。
5. 360(简历拒)
猎头反馈要求高 P(P8+)。
6. Minimax(口头 offer)
面试轮次多(至少 4+ 轮)。前几轮侧重 LeetCode,大模型内容较少,含手写 MHA。最后一轮分配至框架组 Offer,算法组不考虑,未继续接触。薪资较高(总包 100+)。
7. 昆仑万维(offer)
考察大模型训练细节(参数大小、训练细节),无明显 LeetCode。面试官氛围轻松。Offer 薪资相对其他公司略低,但猎头反馈实际给得不错。
8. 云从科技(拒)
两轮面试被拒。二轮面试时长超 2 小时,深入探讨大模型训练细节、模型端、框架端及研究经历。沟通愉快但被拒。
9. 阿里夸克(offer)
4 轮面试,2 轮带 LeetCode。第三轮问标准大模型问题(Transformer、训练、分布式、Loss spike 处理)。第四轮交叉面,涉及搜广推、概率论、OS 问题。总包算上签字费约 70-80+。HR 沟通体验一般。
10. 衔远(offer)
3 面左右,中规中矩。最后一面与周伯文老师聊。提供框架岗位,个人倾向模型相关。薪资较高。
11. 潞晨科技(Colossal-AI)(拒)
主打框架。一面问框架内容(模型切分、Flash-Attention),深度较深。表达想做算法端后,二面问应用端较多,判定不做基座,挂。
12. 蚂蚁(offer)
徐鹏老师团队。二面为徐鹏老师本人,聊经历、大模型、搜广推、实习前后端。团队希望模型研究与工程并重。HR 面后发 Offer,第一年总包加签字费约 70-80。
13. 腾讯(简历拒)
猎头反馈要求 PhD。
14. 小红书(简历拒)
猎头反馈要求 PhD。
15. 商汤(没消息了,被拒)
共两面。一面 LeetCode+ 手写 MHA。二面表现不佳,具体遗忘。后续无消息,被拒。
16. 百川智能(拒)
猎头推荐。一面通过,二面迟到被 HR 以 3 年以上经验为由拒绝。
17. 百度文心(offer)
多轮面试。一面数据组,问数据处理内容。转模型组后面试,内容中规中矩(Transformer、大模型训练)。分组细致(模型、框架、数据分开)。总包底薪 40k+。
18. 科大讯飞(拒)
HR 先聊,认为无法接受合肥地点而拒。
19. IDEA 研究院(拒)
一面即被拒。
20. 好未来(offer)
团队背景相对一般。一面简单 LeetCode 未答上来。模型轮通过后获 Offer。项目为数学相关 GPT 模型。薪资未详聊。
21. 零一万物(拒)
一面阿里推荐系统大佬,问 LeetCode 及推荐系统问题。二面搜广推/NLP 大佬,考 LeetCode 未答出,挂。


