国内多家大厂大模型岗位面试经验汇总
面试概况
本次分享涵盖了投递的多家互联网及科技公司的大模型相关岗位,包括淘天、字节、蚂蚁、商汤、美团、夸克、腾讯、MiniMax、零一万物、阿里控股、潞晨科技、阿里巴巴国际、网易实验室、Momenta 等。
获得 Offer 的公司:淘天、字节 AML、商汤、蚂蚁、美团、夸克、腾讯混元、天翼云。
以下是对各公司面试流程、技术考察点及体验的详细复盘。
淘天集团【Offer】
部门介绍
未来生活实验室。淘天集团的大模型研究主要围绕搜广推和逛逛内容化两个场景展开。团队由淘天集团高层共同牵头。
面试流程
一面
- 如何训练 OCR 任务?
- 实验的 Setting 设置?
- OCR 任务的影响评估方式?
- 高分辨率训练后在小分辨率上是否会崩溃?
- 输出 BBox(边界框)是否有优化方案?
HR 面
- 基本信息确认。
- 考研进入电子科技大学的原因。
- 为什么选择加入诺亚实验室。
- 代表性工作介绍。
- 解决问题的思路,特别是国内语言大模型与多模态大模型的现状对比。
- 大模型的评测指标与评估体系。
- 如何看待行业内的刷榜问题。
面试体验
面试体验良好,HR 态度专业且不过于咄咄逼人,阿里文化气息不浓。最终权衡后选择了淘天。
字节跳动 AML【Offer】
部门介绍
AML 火山方舟大模型部门。专注于大模型的基础研究与落地应用。
面试流程
预备面经(猎头提供)
- 设计一个 Hash 表。
- 蓄水池采样问题。
- 从超大文本文件中随机行采样。
- 二叉搜索树 - 去掉超出 [m, n] 范围内的节点。
- 计算交叉熵。
- 计算 IOU(交并比)。
一面
- 多模态大模型的流程是怎样的?
- OCR 的具体结构是什么?
- LayerNorm 的区别与应用场景。
二面
- 什么时候开始做多模态模型?
- 目前在文档处理方面的进展。
- Token 长度过大时,高分辨率如何解决?
- Patch 大小的调整策略。
- VQGAN 的原理与应用。
- GPT4V 的结构形式。
- LLM Decoder 机制。
- MagViT 架构。
- LLM 基础知识补充建议。
三面
- 自我介绍。
- 多模态大模型选用的基座模型。
- Transformer 架构的熟悉程度。
- Python 实现 Self Attention 和 Transformer。
面试体验
字节一如既往地注重 Coding 能力,基本每一面包含两道算法题。一面面试官经验不足,体验一般;整体拿到 Offer 属于运气与实力并存。
商汤科技【Offer】
面试流程
一面
- 简单的自我介绍。
- 高分辨率图像的解决办法。
- OCR 的实现细节,是否涉及 Grounding 或 Referring。


