国内大模型企业面试复盘与经验总结

详细复盘了作者在 2023 年期间面试国内多家大模型企业的经历，涵盖智元机器人、面壁科技、Minimax、阿里、百度等公司的面试流程与结果。文章总结了当前大模型行业的竞争态势、岗位技能需求优先级及薪资水平。重点梳理了高频面试考点，包括多头注意力机制、Transformer 架构细节、分布式并行训练策略、训练技巧及评估体系，并提供了具体的备考建议和技术深化方向，旨在帮助算法工程师更好地准备大模型相关岗位的面试。

草莓泡芙发布于 2025/2/6更新于 2026/7/2438 浏览

国内大模型企业面试复盘与经验总结

2023 年三月前后，大模型在国内迅速兴起，笔者在此期间面了多家大厂及初创公司。近期多位同行朋友对大模型岗位面试感兴趣，特将经历综合整理如下，希望能与各位交流。由于时间跨度较长（最早面试距今已半年），部分细节记忆可能模糊，列表顺序大致按面试时间排列。

后文会总结面试经验感悟及建议注重的内容，一家之言仅供参考。

一、面试经历概览

1. 智元机器人（Agibot）

当时处于早期组建团队阶段，一面由创始人稚晖君亲自面试。主要询问简历经历及 Transformer 相关基础问题，如 MHA 机制、复杂度分析、BERT/GPT 架构差异等。后续未收到回复，判定为未通过。与大牛交流体验顺畅，看好具身智能方向。

2. 面壁科技/面壁智能

共两面。技术面涉及大模型训练、Transformer 细节及过往项目经历；二面直接沟通 Offer 事宜。团队年轻，清华背景居多。资金充足，薪资包具有竞争力。

3. 光年之外

猎头推荐，简历筛选阶段被拒。

4. 北京智源人工智能研究院

共 3-4 轮面试，面试官来自不同团队（Evaluation、训练等）。整体感觉偏向招募 Evaluation 方向人才。中途有一次面试官爽约，后续 HR 未再跟进，默认为拒。

5. 360

猎头沟通时定位为高 P（P8+），最终简历被拒。

6. Minimax

面试轮次较多（至少 4+ 轮）。前几轮侧重 LeetCode，大模型内容问得较浅，其中一面要求手写 MHA。最后一轮主管面后分配至框架组 Offer，咨询算法组机会被否。薪资总包较高，但业务方向沟通较少。

7. 昆仑万维

面试涉及大模型训练细节，如参数量级、训练技巧等，未见 LeetCode。面试官氛围轻松。Offer 薪资相对其他家略低，但猎头反馈其整体待遇不错。

8. 云从科技

两轮面试被拒。第二轮面试时长异常（设定 1 小时，实际聊 2 小时），深入探讨了模型端、框架端及研究细节。虽交流愉快，但未通过。

9. 阿里夸克

共 4 轮。含 2 轮 LeetCode，穿插大模型经验问答。第三轮为标准大模型问题（Transformer、分布式训练、Loss Spike 处理等）。第四轮交叉面试，涉及搜广推概率论及 OS 问题。Offer 流程中 HR 沟通体验一般。

10. 衔远

约 3 面，问题中规中矩。终面与周伯文老师交流。提供框架岗位，个人意向为模型岗，薪资较高。

11. 潞晨科技（Colossal-AI）

主打框架，一面深挖模型切分方式及 Flash Attention 等内容。表达想做算法端后，二面转算法组，侧重应用端，因基座方向 HC 有限未通过。框架端在圈内口碑较好。

12. 蚂蚁集团

徐鹏老师团队。二面由徐鹏老师本人面试，涵盖大模型、搜广推及实习经历。团队强调 Research 与 Engineering 不分家，观点契合。HR 面后快速发 Offer，首年签字费可观。

13. 腾讯

猎头反馈需 PhD 学历，简历被拒。

14. 小红书

猎头反馈需 PhD 学历，简历被拒。

15. 商汤科技

共两面。一面含 LeetCode 及手写 MHA，表现尚可。二面回答不佳，具体遗忘。后续无消息，判定为拒。

16. 百川智能

猎头安排面试，一面通过后，二面因迟到被 HR 以经验年限不足为由拒绝。

17. 百度文心

多轮面试。一面数据组，侧重数据处理；申请转模型组后，二面起由模型组负责。内容涵盖 Transformer 及训练细节，分组细致（模型、框架、数据分离）。薪资底薪较高。

18. 科大讯飞

HR 初筛因工作地点（合肥）原因直接拒绝。

19. IDEA 研究院

一面即被拒，印象不深。

20. 好未来

国内大模型企业面试复盘与经验总结

后文会总结面试经验感悟及建议注重的内容，一家之言仅供参考。

一、面试经历概览

1. 智元机器人（Agibot）

2. 面壁科技/面壁智能

共两面。技术面涉及大模型训练、Transformer 细节及过往项目经历；二面直接沟通 Offer 事宜。团队年轻，清华背景居多。资金充足，薪资包具有竞争力。

3. 光年之外

猎头推荐，简历筛选阶段被拒。

4. 北京智源人工智能研究院

5. 360

猎头沟通时定位为高 P（P8+），最终简历被拒。

6. Minimax

7. 昆仑万维

面试涉及大模型训练细节，如参数量级、训练技巧等，未见 LeetCode。面试官氛围轻松。Offer 薪资相对其他家略低，但猎头反馈其整体待遇不错。

8. 云从科技

两轮面试被拒。第二轮面试时长异常（设定 1 小时，实际聊 2 小时），深入探讨了模型端、框架端及研究细节。虽交流愉快，但未通过。

9. 阿里夸克

10. 衔远

约 3 面，问题中规中矩。终面与周伯文老师交流。提供框架岗位，个人意向为模型岗，薪资较高。

11. 潞晨科技（Colossal-AI）

12. 蚂蚁集团

13. 腾讯

猎头反馈需 PhD 学历，简历被拒。

14. 小红书

猎头反馈需 PhD 学历，简历被拒。

15. 商汤科技

共两面。一面含 LeetCode 及手写 MHA，表现尚可。二面回答不佳，具体遗忘。后续无消息，判定为拒。

16. 百川智能

猎头安排面试，一面通过后，二面因迟到被 HR 以经验年限不足为由拒绝。

国内大模型企业面试复盘与经验总结

国内大模型企业面试复盘与经验总结

一、面试经历概览

1. 智元机器人（Agibot）

2. 面壁科技/面壁智能

3. 光年之外

4. 北京智源人工智能研究院

5. 360

6. Minimax

7. 昆仑万维

8. 云从科技

9. 阿里夸克

10. 衔远

11. 潞晨科技（Colossal-AI）

12. 蚂蚁集团

13. 腾讯

14. 小红书

15. 商汤科技

16. 百川智能

17. 百度文心

18. 科大讯飞

19. IDEA 研究院

20. 好未来

国内大模型企业面试复盘与经验总结

国内大模型企业面试复盘与经验总结

一、面试经历概览

1. 智元机器人（Agibot）

2. 面壁科技/面壁智能

3. 光年之外

4. 北京智源人工智能研究院

5. 360

6. Minimax

7. 昆仑万维

8. 云从科技

9. 阿里夸克

10. 衔远

11. 潞晨科技（Colossal-AI）

12. 蚂蚁集团

13. 腾讯

14. 小红书

15. 商汤科技

16. 百川智能

17. 百度文心

18. 科大讯飞

19. IDEA 研究院

20. 好未来

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

21. 零一万物

22. 月之暗面（Moonshot）

23. 阿里达摩院（新达摩）

24. 边塞科技

二、面试感悟与市场观察

三、高频考点与技术详解

1. 多头注意力机制（MHA）

2. Transformer 架构细节

3. 并行训练策略

4. 大模型训练技巧

5. 评估体系（Evaluation）

6. 多模态与 RLHF

四、备考建议

五、结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具