面试情况
投过的公司:淘天,字节,蚂蚁,商汤,美团,夸克,腾讯,minimax,零一万物,阿里控股,潞晨科技,阿里巴巴国际,网易实验室,Momenta。
Offer:淘天,字节 AML,商汤,蚂蚁,美团,夸克,腾讯混元,天翼云。
以下是面经分享。
淘天【offer】
部门:未来生活实验室
介绍:淘天集团的大模型研究将主要围绕两个场景展开:一是搜广推,二是逛逛的内容化。团队组建工作由淘天集团 CEO 戴珊、淘天集团 CTO 若海、阿里妈妈 CTO 郑波等人共同牵头。
面经
一面:
- 如何训练 OCR 任务
- 实验的 setting
- OCR 任务影响如何
- 高分辨率训练,再在小分辨率上,会不会崩掉
- 输出 bbox 有没有好的方式
HR 面:
- 基本信息确认
- 考研进入电子科技大,为什么
- 为什么进入了诺亚
- 代表性的工作
- 如何解决问题的,国内在做语言大模型的多一些
- 国内在做多模态大模型的
- 如何评测,评估这些大模型的。如何看待刷榜的问题
- 你们的衡量指标
面试体验
面试体验很好。HR 也没有那么咄咄逼人。阿里味不是特别明显。最终权衡也选择来了淘天。
字节 AML【offer】
部门:AML 火山方舟大模型
介绍:字节跳动在 AML(AI Model Layer)方向投入巨大,专注于大模型的基础研究与行业应用落地。
预备面经
猎头提供了一些其他候选人的面经,整理如下:
- 设计一个 Hash 表
- 蓄水池问题
- 从超大文本文件中随机行采样
- 二叉搜索树 - 去掉超出 [m, n] 范围内的节点
- 计算交叉熵
- 计算 IOU
一面:
- 多模态你们的流程
- 你们的 OCR 的结构
- layernorm 的区别
二面:
- 什么时间开始做多模态模型
- 目前在文档
- Token 长度太大。高分辨率如何解决
- patch 能不能变得
- VQGAN
- GPT4V 的结构形式
- LLM decoder
- MagViT
- LLM 的基础知识需要尽快补上
三面:
- 自我介绍
- 多模态大模型用哪个模型
- Transformer 比较熟悉
- python 实现 self attention 和 Transformer
面试体验
字节一如既往的注重 coding,基本每一面两道题,自己能拿到 offer 也算是运气吧。一面的面试体验很差,可以说是毫无面试经验的面试官。
商汤【offer】
一面:
- 简单的自我介绍
- 关于高分辨率的解决办法
- OCR 是如何去做的,有没有 grounding,Referring
- GPT4V 位置,检测明显的问题
- 你们是如何解决位置信息的


