国内 20 家公司大模型岗位面试经验汇总
面试情况概览
投递公司:淘天、字节、蚂蚁、商汤、美团、夸克、腾讯、MiniMax、零一万物、阿里控股、潞晨科技、阿里巴巴国际、网易实验室、Momenta。
获得 Offer:淘天、字节 AML、商汤、蚂蚁、美团、夸克、腾讯混元、天翼云。
以下是详细面经分享与复盘。
淘天【Offer】
部门:未来生活实验室
介绍:淘天集团的大模型研究主要围绕搜广推和逛逛内容化两个场景展开。团队由淘天集团 CEO 戴珊、CTO 若海、阿里妈妈 CTO 郑波等人共同牵头。
面经
一面:
- 如何训练 OCR 任务?
- 实验的 Setting 是什么?
- OCR 任务影响如何评估?
- 高分辨率训练后,在小分辨率上会不会崩掉?
- 输出 BBox 有没有好的方式?
HR 面:
- 基本信息确认。
- 考研进入电子科技大的原因。
- 为什么进入了诺亚?
- 代表性工作介绍。
- 如何解决问题的?国内在做语言大模型的多一些,多模态大模型怎么做?
- 如何评测、评估这些大模型?如何看待刷榜的问题?
- 你们的衡量指标是什么?
面试体验:面试体验很好。HR 没有咄咄逼人,阿里味不重。最终权衡后选择加入淘天。
字节 AML【Offer】
部门:AML 火山方舟大模型
介绍:专注于大模型相关研究与应用。
预备面经
猎头提供了一些其他候选人的面经整理如下:
- 设计一个 Hash 表。
- 蓄水池问题。
- 从超大文本文件中随机行采样。
- 二叉搜索树 - 去掉超出 [m, n] 范围内的节点。
- 计算交叉熵。
- 计算 IoU。
一面:
- 多模态你们的流程?
- 你们的 OCR 的结构?
- LayerNorm 的区别?
二面:
- 什么时间开始做多模态模型?
- 目前在文档处理方面?
- Token 长度太大,高分辨率如何解决?
- Patch 能不能变得更大?
- VQGAN 相关问题。
- GPT4V 的结构形式。
- LLM Decoder 原理。
- MagViT 架构。
- LLM 基础知识需要尽快补上。
三面:
- 自我介绍。
- 多模态大模型用哪个模型?
- Transformer 比较熟悉吗?
- Python 实现 Self Attention 和 Transformer。
面试体验:字节一如既往注重 Coding,基本每一面两道题。能拿到 Offer 算是运气。一面的面试体验较差,面试官似乎缺乏面试经验。
商汤【Offer】
一面:
- 简单的自我介绍。
- 关于高分辨率的解决办法。
- OCR 是如何去做的,有没有 Grounding、Referring?
- GPT4V 位置检测明显的问题。


