国内大模型公司面试经历与心得总结

综述由AI生成总结了作者在 2023 年参与多家国内大模型及互联网公司的面试经历，涵盖智元机器人、面壁科技、Minimax、阿里夸克、蚂蚁、百度文心等企业的面试流程与结果。内容包含对面试官背景、考察重点（如 Transformer 架构、分布式训练、MHA 实现）的分析，以及针对基座算法岗位的复习建议。文章还梳理了高频考点，包括注意力机制、并行策略、数据处理及评估方法，并为求职者提供了技术栈发展方向的参考意见。

虚拟内存发布于 2025/2/7更新于 2026/6/225 浏览

2023 年，大模型在国内迅速兴起，笔者参与了多家大厂及初创公司的面试。本文综合整理了面试经验、感悟及技术考察重点，旨在为同行提供参考。

面试经历概览

智元机器人（Agibot）：一面由创始人稚晖君主面，考察简历经历及 Transformer 基础（MHA、复杂度、BERT/GPT）。后续无反馈，判定未通过。具身智能方向值得关注。
面壁科技/面壁智能：两面，侧重训练细节与 Transformer 内容。团队年轻，清华背景居多，资金充足，薪资较高。
光年之外：猎头推荐，简历阶段被拒。
北京智源人工智能研究院：3-4 轮面试，涉及 Evaluation 与训练团队。流程中面试官爽约且后续无消息，默拒。
360：猎头沟通高 P 岗位（P8+），简历被拒。
Minimax：4+ 轮面试，侧重 LeetCode，大模型问题较浅。最后一轮分配至框架组，算法组机会较少。薪资较高但业务方向沟通不足。
昆仑万维：考察训练细节（参数量、参数大小等），无 LeetCode。薪资相对其他公司略低，但猎头反馈整体尚可。
云从科技：两轮面试，第二轮时长超 2 小时，深入探讨模型端、框架端及研究细节。虽交流愉快但最终被拒。
阿里夸克：4 轮面试，含 2 轮 LeetCode。第三轮考察标准大模型问题（Transformer、分布式、Loss Spike 处理）。第四轮交叉面试涉及搜广推概率论及 OS 知识。Offer 发放后 HR 沟通体验一般。
衔远：3 轮面试，最后一面与周伯文老师交流。提供框架岗位，薪资较高，但个人意向为模型相关。
潞晨科技（Colossal-AI）：框架为主，考察模型切分、Flash-Attention 等底层技术。表达想做算法后转岗算法组，因 HC 少及基座方向不明确被拒。
蚂蚁：徐鹏老师团队。强调 Research 与 Engineering 不分家。HR 面后直接发 Offer，首年总包包含签字费。
腾讯：猎头要求 PhD，简历被拒。
小红书：猎头要求 PhD，简历被拒。
商汤：两轮面试，一面 LeetCode+手写 MHA，二面表现不佳，最终被拒。
百川智能：一面通过后，二面迟到导致被拒，理由称需 3 年以上经验。
百度文心：多轮面试，数据组转模型组。考察 Transformer、训练细节。分组细致（模型、框架、数据分离），薪资底薪较高。
科大讯飞：HR 沟通阶段因地点（合肥）原因被拒。
IDEA 研究院：一面即被拒。
好未来：团队背景相对一般，一面 LeetCode 未答出，模型轮通过。项目涉及数学 GPT 模型。
零一万物：一面推荐系统经验，二面复杂 LeetCode 未通过。好奇后续是否有大模型专家面试。
月之暗面（Moonshot）：面试专业度极高。考察 Transformer、分布式通信（Ring-Reduce）、CUDA 实现及难 LeetCode。创始人及团队背景顶尖，可惜未通过。
阿里达摩院（新达摩院）：一面 LeetCode 补考 Coding，二面与大老板交流愿景。纯研究方向，算力强，聚焦 LLM 与多模态。
边塞科技：专注 RLHF 微调，清华背景。RL 经验不足导致未通过。

面试感悟

竞争激烈：新技术与新 Paper 迭代快，面试内容更新频繁。
工程与科研并重：Research 岗位对工程能力有要求，工程端也需理解模型原理。
硬核岗位全栈化：尤其是初创公司，往往要求同时掌握应用、模型、框架、后端甚至硬件知识。
技术栈建议：模型 > 框架 > 底层 > 其他。建议在保持模型能力的同时，补充 Kernel 等底层能力。

国内大模型公司面试经历与心得总结

虚拟内存发布于 2025/2/7更新于 2026/6/225 浏览

2023 年，大模型在国内迅速兴起，笔者参与了多家大厂及初创公司的面试。本文综合整理了面试经验、感悟及技术考察重点，旨在为同行提供参考。

面试经历概览

智元机器人（Agibot）：一面由创始人稚晖君主面，考察简历经历及 Transformer 基础（MHA、复杂度、BERT/GPT）。后续无反馈，判定未通过。具身智能方向值得关注。
面壁科技/面壁智能：两面，侧重训练细节与 Transformer 内容。团队年轻，清华背景居多，资金充足，薪资较高。
光年之外：猎头推荐，简历阶段被拒。
北京智源人工智能研究院：3-4 轮面试，涉及 Evaluation 与训练团队。流程中面试官爽约且后续无消息，默拒。
360：猎头沟通高 P 岗位（P8+），简历被拒。
Minimax：4+ 轮面试，侧重 LeetCode，大模型问题较浅。最后一轮分配至框架组，算法组机会较少。薪资较高但业务方向沟通不足。
昆仑万维：考察训练细节（参数量、参数大小等），无 LeetCode。薪资相对其他公司略低，但猎头反馈整体尚可。
云从科技：两轮面试，第二轮时长超 2 小时，深入探讨模型端、框架端及研究细节。虽交流愉快但最终被拒。
阿里夸克：4 轮面试，含 2 轮 LeetCode。第三轮考察标准大模型问题（Transformer、分布式、Loss Spike 处理）。第四轮交叉面试涉及搜广推概率论及 OS 知识。Offer 发放后 HR 沟通体验一般。
衔远：3 轮面试，最后一面与周伯文老师交流。提供框架岗位，薪资较高，但个人意向为模型相关。
潞晨科技（Colossal-AI）：框架为主，考察模型切分、Flash-Attention 等底层技术。表达想做算法后转岗算法组，因 HC 少及基座方向不明确被拒。
蚂蚁：徐鹏老师团队。强调 Research 与 Engineering 不分家。HR 面后直接发 Offer，首年总包包含签字费。
腾讯：猎头要求 PhD，简历被拒。
小红书：猎头要求 PhD，简历被拒。
商汤：两轮面试，一面 LeetCode+手写 MHA，二面表现不佳，最终被拒。
百川智能：一面通过后，二面迟到导致被拒，理由称需 3 年以上经验。
百度文心：多轮面试，数据组转模型组。考察 Transformer、训练细节。分组细致（模型、框架、数据分离），薪资底薪较高。
科大讯飞：HR 沟通阶段因地点（合肥）原因被拒。
IDEA 研究院：一面即被拒。
好未来：团队背景相对一般，一面 LeetCode 未答出，模型轮通过。项目涉及数学 GPT 模型。
零一万物：一面推荐系统经验，二面复杂 LeetCode 未通过。好奇后续是否有大模型专家面试。
月之暗面（Moonshot）：面试专业度极高。考察 Transformer、分布式通信（Ring-Reduce）、CUDA 实现及难 LeetCode。创始人及团队背景顶尖，可惜未通过。
阿里达摩院（新达摩院）：一面 LeetCode 补考 Coding，二面与大老板交流愿景。纯研究方向，算力强，聚焦 LLM 与多模态。
边塞科技：专注 RLHF 微调，清华背景。RL 经验不足导致未通过。

面试感悟

竞争激烈：新技术与新 Paper 迭代快，面试内容更新频繁。
工程与科研并重：Research 岗位对工程能力有要求，工程端也需理解模型原理。
硬核岗位全栈化：尤其是初创公司，往往要求同时掌握应用、模型、框架、后端甚至硬件知识。
技术栈建议：模型 > 框架 > 底层 > 其他。建议在保持模型能力的同时，补充 Kernel 等底层能力。

国内大模型公司面试经历与心得总结

面试经历概览

面试感悟

国内大模型公司面试经历与心得总结

面试经历概览

面试感悟

更多推荐文章

相关免费在线工具

高频考点详解

1. 多头注意力机制 (Multi-Head Attention)

2. 框架与并行策略

3. 主流模型架构细节

4. 大模型训练实战

5. 数据处理

6. 评估体系

7. 扩展领域

结语

更多推荐文章

相关免费在线工具

国内大模型公司面试经历与心得总结

面试经历概览

面试感悟

国内大模型公司面试经历与心得总结

面试经历概览

面试感悟

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

高频考点详解

1. 多头注意力机制 (Multi-Head Attention)

2. 框架与并行策略

3. 主流模型架构细节

4. 大模型训练实战

5. 数据处理

6. 评估体系

7. 扩展领域

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具