国内 20 家大厂大模型岗位面试复盘与技术要点总结
大模型技术近期发展迅速,在多个领域展现出巨大潜力。然而,其商业化成功及适应监管变化的能力仍是关键。本文基于真实的大模型岗位面试经历,分享多家公司的面经、技术考察点及面试体验,旨在帮助求职者更好地准备。
面试概况
投递公司: 淘天、字节、蚂蚁、商汤、美团、夸克、腾讯、MiniMax、零一万物、阿里控股、潞晨科技、阿里巴巴国际、网易实验室、Momenta 等。
获得 Offer: 淘天、字节 AML、商汤、蚂蚁、美团、夸克、腾讯混元、天翼云。
详细面经
1. 淘天集团【Offer】
部门: 未来生活实验室
业务方向: 搜广推、逛逛内容化。团队由戴珊、若海、郑波等人牵头。
一面
- 如何训练 OCR 任务?
- 实验的 Setting 设置细节。
- OCR 任务对整体效果的影响评估。
- 高分辨率训练后在小分辨率上是否会崩溃?
- 输出 Bounding Box 是否有优化方式?
HR 面
- 基本信息确认:考研进入电子科大原因,为何加入诺亚。
- 代表性工作介绍。
- 问题解决思路:国内语言大模型较多,多模态大模型现状。
- 评测与评估:如何看待刷榜问题,衡量指标是什么。
面试体验: 体验良好,HR 态度专业,阿里味不重。最终选择淘天。
2. 字节跳动 AML【Offer】
部门: 火山方舟大模型
预备面经(猎头提供)
- 设计一个 Hash 表。
- 蓄水池采样问题。
- 从超大文本文件中随机行采样。
- 二叉搜索树 - 去掉超出 [m, n] 范围内的节点。
- 计算交叉熵。
- 计算 IOU。
一面
- 多模态处理流程。
- OCR 结构解析。
- LayerNorm 的区别。
二面
- 多模态模型起步时间。
- 文档场景下的 Token 长度过大问题及高分辨率解决方案。
- Patch 机制调整。
- VQGAN 结构。
- GPT4V 的结构形式。
- LLM Decoder 原理。
- MagViT 架构。
- 建议: LLM 基础知识需尽快补全。
三面
- 自我介绍。
- 多模态大模型选型。
- Transformer 熟悉度。
- Python 实现 Self Attention 和 Transformer。
面试体验: 注重 Coding,每面两道题。一面体验一般,面试官缺乏经验。
3. 商汤科技【Offer】
一面
- 自我介绍。
- 高分辨率解决办法。
- OCR 是否包含 Grounding/Referring。
- GPT4V 在位置检测上的明显问题及解决方式。
- 新模态数据的拼接方式。
- 新数据批次训练策略。
- Tree 结构判断:Tree1 是否是 Tree2 的子树。


