2023 年,大模型在国内迅速兴起,笔者参与了多家大厂及初创公司的面试。本文综合整理了面试经验、感悟及技术考察重点,旨在为同行提供参考。
面试经历概览
- 智元机器人(Agibot):一面由创始人稚晖君主面,考察简历经历及 Transformer 基础(MHA、复杂度、BERT/GPT)。后续无反馈,判定未通过。具身智能方向值得关注。
- 面壁科技/面壁智能:两面,侧重训练细节与 Transformer 内容。团队年轻,清华背景居多,资金充足,薪资较高。
- 光年之外:猎头推荐,简历阶段被拒。
- 北京智源人工智能研究院:3-4 轮面试,涉及 Evaluation 与训练团队。流程中面试官爽约且后续无消息,默拒。
- 360:猎头沟通高 P 岗位(P8+),简历被拒。
- Minimax:4+ 轮面试,侧重 LeetCode,大模型问题较浅。最后一轮分配至框架组,算法组机会较少。薪资较高但业务方向沟通不足。
- 昆仑万维:考察训练细节(参数量、参数大小等),无 LeetCode。薪资相对其他公司略低,但猎头反馈整体尚可。
- 云从科技:两轮面试,第二轮时长超 2 小时,深入探讨模型端、框架端及研究细节。虽交流愉快但最终被拒。
- 阿里夸克:4 轮面试,含 2 轮 LeetCode。第三轮考察标准大模型问题(Transformer、分布式、Loss Spike 处理)。第四轮交叉面试涉及搜广推概率论及 OS 知识。Offer 发放后 HR 沟通体验一般。
- 衔远:3 轮面试,最后一面与周伯文老师交流。提供框架岗位,薪资较高,但个人意向为模型相关。
- 潞晨科技(Colossal-AI):框架为主,考察模型切分、Flash-Attention 等底层技术。表达想做算法后转岗算法组,因 HC 少及基座方向不明确被拒。
- 蚂蚁:徐鹏老师团队。强调 Research 与 Engineering 不分家。HR 面后直接发 Offer,首年总包包含签字费。
- 腾讯:猎头要求 PhD,简历被拒。
- 小红书:猎头要求 PhD,简历被拒。
- 商汤:两轮面试,一面 LeetCode+手写 MHA,二面表现不佳,最终被拒。
- 百川智能:一面通过后,二面迟到导致被拒,理由称需 3 年以上经验。
- 百度文心:多轮面试,数据组转模型组。考察 Transformer、训练细节。分组细致(模型、框架、数据分离),薪资底薪较高。
- 科大讯飞:HR 沟通阶段因地点(合肥)原因被拒。
- IDEA 研究院:一面即被拒。
- 好未来:团队背景相对一般,一面 LeetCode 未答出,模型轮通过。项目涉及数学 GPT 模型。
- 零一万物:一面推荐系统经验,二面复杂 LeetCode 未通过。好奇后续是否有大模型专家面试。
- 月之暗面(Moonshot):面试专业度极高。考察 Transformer、分布式通信(Ring-Reduce)、CUDA 实现及难 LeetCode。创始人及团队背景顶尖,可惜未通过。
- 阿里达摩院(新达摩院):一面 LeetCode 补考 Coding,二面与大老板交流愿景。纯研究方向,算力强,聚焦 LLM 与多模态。
- 边塞科技:专注 RLHF 微调,清华背景。RL 经验不足导致未通过。
面试感悟
- 竞争激烈:新技术与新 Paper 迭代快,面试内容更新频繁。
- 工程与科研并重:Research 岗位对工程能力有要求,工程端也需理解模型原理。
- 硬核岗位全栈化:尤其是初创公司,往往要求同时掌握应用、模型、框架、后端甚至硬件知识。
- 技术栈建议:模型 > 框架 > 底层 > 其他。建议在保持模型能力的同时,补充 Kernel 等底层能力。


