国内大模型企业面试复盘与经验总结
本文详细复盘了作者在 2023 年期间面试国内多家大模型企业的经历,涵盖智元机器人、面壁科技、Minimax、阿里、百度等公司的面试流程与结果。文章总结了当前大模型行业的竞争态势、岗位技能需求优先级及薪资水平。重点梳理了高频面试考点,包括多头注意力机制、Transformer 架构细节、分布式并行训练策略、训练技巧及评估体系,并提供了具体的备考建议和技术深化方向,旨在帮助算法工程师更好地准备大模型相关岗位的面试。

本文详细复盘了作者在 2023 年期间面试国内多家大模型企业的经历,涵盖智元机器人、面壁科技、Minimax、阿里、百度等公司的面试流程与结果。文章总结了当前大模型行业的竞争态势、岗位技能需求优先级及薪资水平。重点梳理了高频面试考点,包括多头注意力机制、Transformer 架构细节、分布式并行训练策略、训练技巧及评估体系,并提供了具体的备考建议和技术深化方向,旨在帮助算法工程师更好地准备大模型相关岗位的面试。

2023 年三月前后,大模型在国内迅速兴起,笔者在此期间面了多家大厂及初创公司。近期多位同行朋友对大模型岗位面试感兴趣,特将经历综合整理如下,希望能与各位交流。由于时间跨度较长(最早面试距今已半年),部分细节记忆可能模糊,列表顺序大致按面试时间排列。
后文会总结面试经验感悟及建议注重的内容,一家之言仅供参考。
当时处于早期组建团队阶段,一面由创始人稚晖君亲自面试。主要询问简历经历及 Transformer 相关基础问题,如 MHA 机制、复杂度分析、BERT/GPT 架构差异等。后续未收到回复,判定为未通过。与大牛交流体验顺畅,看好具身智能方向。
共两面。技术面涉及大模型训练、Transformer 细节及过往项目经历;二面直接沟通 Offer 事宜。团队年轻,清华背景居多。资金充足,薪资包具有竞争力。
猎头推荐,简历筛选阶段被拒。
共 3-4 轮面试,面试官来自不同团队(Evaluation、训练等)。整体感觉偏向招募 Evaluation 方向人才。中途有一次面试官爽约,后续 HR 未再跟进,默认为拒。
猎头沟通时定位为高 P(P8+),最终简历被拒。
面试轮次较多(至少 4+ 轮)。前几轮侧重 LeetCode,大模型内容问得较浅,其中一面要求手写 MHA。最后一轮主管面后分配至框架组 Offer,咨询算法组机会被否。薪资总包较高,但业务方向沟通较少。
面试涉及大模型训练细节,如参数量级、训练技巧等,未见 LeetCode。面试官氛围轻松。Offer 薪资相对其他家略低,但猎头反馈其整体待遇不错。
两轮面试被拒。第二轮面试时长异常(设定 1 小时,实际聊 2 小时),深入探讨了模型端、框架端及研究细节。虽交流愉快,但未通过。
共 4 轮。含 2 轮 LeetCode,穿插大模型经验问答。第三轮为标准大模型问题(Transformer、分布式训练、Loss Spike 处理等)。第四轮交叉面试,涉及搜广推概率论及 OS 问题。Offer 流程中 HR 沟通体验一般。
约 3 面,问题中规中矩。终面与周伯文老师交流。提供框架岗位,个人意向为模型岗,薪资较高。
主打框架,一面深挖模型切分方式及 Flash Attention 等内容。表达想做算法端后,二面转算法组,侧重应用端,因基座方向 HC 有限未通过。框架端在圈内口碑较好。
徐鹏老师团队。二面由徐鹏老师本人面试,涵盖大模型、搜广推及实习经历。团队强调 Research 与 Engineering 不分家,观点契合。HR 面后快速发 Offer,首年签字费可观。
猎头反馈需 PhD 学历,简历被拒。
猎头反馈需 PhD 学历,简历被拒。
共两面。一面含 LeetCode 及手写 MHA,表现尚可。二面回答不佳,具体遗忘。后续无消息,判定为拒。
猎头安排面试,一面通过后,二面因迟到被 HR 以经验年限不足为由拒绝。
多轮面试。一面数据组,侧重数据处理;申请转模型组后,二面起由模型组负责。内容涵盖 Transformer 及训练细节,分组细致(模型、框架、数据分离)。薪资底薪较高。
HR 初筛因工作地点(合肥)原因直接拒绝。
一面即被拒,印象不深。
团队背景相对一般。一面 LeetCode 未答出,模型轮表现尚可获 Offer。项目涉及数学相关 GPT 模型。
一面阿里推荐系统大佬,LeetCode 及推荐系统问题表现尚可。二面搜广推/NLP 大佬,LeetCode 难题未解,挂掉。
面试专业度极高。一面涉及 Transformer 基础、分布式训练底层通信(Ring-Reduce 实现)、CUDA 编程能力考察及高难度 LeetCode。创始人及团队背景顶尖,可惜未通过。
一面 LeetCode 及大模型技术;二面团队负责人,探讨高层愿景及市场方向。纯研究方向,算力强劲,聚焦 LLM 及多模态。因一面 Coding 较弱补考 Coding 后获 Offer。
专注 RLHF 微调,清华背景,创始人有 OpenAI 经验。RL 方向积累深厚,因个人 RL 经验不足未通过。
这段时间面试多家企业,收获颇丰。自身背景以基座预训练算法为主,对框架和 RL 有一定了解,后端知识(ML Compiler, Kernel, CUDA)较浅,硬件几乎不懂。综合来看:
针对基座算法/框架岗位,以下知识点出现频率极高,建议重点复习:
这是必考题,涵盖概念、代码实现及优化。
大模型领域正处于快速迭代期,技术门槛高且变化快。求职者需在保持算法深度的同时,拓宽工程视野。希望本文整理的经验能为正在求职的同行提供有价值的参考。如有遗漏或错误,欢迎指正。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online