跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

AGI 大模型算法岗位面试经验汇总

综述由AI生成汇总了字节跳动、饿了么、网易伏羲、好未来等大厂 AGI 与大模型算法岗位的面试经验。内容涵盖多模态算法、AIGC 实习生的一二面流程,重点记录了关于 Transformer 结构、位置编码、RLHF、RAG、DDPM 等技术问题的考察,以及字符串旋转、岛屿数量、组合总和等算法题。文章同时补充了核心知识点的详细解析,旨在帮助求职者系统复习大模型相关理论与工程实践。

KernelLab发布于 2025/2/6更新于 2026/6/424 浏览
AGI 大模型算法岗位面试经验汇总

AGI 大模型算法岗位面试经验汇总

本文汇总了字节、饿了么、网易伏羲、好未来等大厂的大模型及 AIGC 相关岗位的面试经历,涵盖了一面、二面的技术考察点与算法题,并补充了核心知识点解析,供求职者参考。

字节跳动 暑期实习 多模态算法 (二面)

一面 (2024/3/28)

  1. 自我介绍:无自我介绍环节,直接进入正题。
  2. 论文介绍:详细介绍 NeurIPS 论文,面试官穿插提问。
  3. Transformer 基础:询问 Transformer 的整体结构。
  4. 位置编码:了解有哪些位置编码方式?
  5. RoPE 详解:具体说明 LLaMA 中的旋转位置编码(Rotary Position Embedding)原理。
  6. 算法题 1:求平方根,使用牛顿迭代法实现。
  7. 算法题 2:判断一个字符串能否由另一个字符串旋转而来(如 abcd -> dabc),要求 O(1) 时间复杂度。
  8. 项目经历:详细询问快手用户推荐算法实习内容。
  9. 结合能力:NeurIPS 论文如何与推荐系统结合?
  10. 动态性思考:论文中是否考虑事件属性或动态性?后续计划如何改进?
  11. 本科项目:负荷预测的背景、输入输出及常用模型。

二面 (2024/4/8)

  1. 自我介绍。
  2. 项目深挖:详细介绍快手实习经历,穿插十余个相关问题。
  3. 论文复述:再次介绍 NeurIPS 论文。
  4. 注意力机制:Transformer 的多头注意力机制(Multi-Head Attention)原理。
  5. 算法题 1:BFS 求岛屿数量。
  6. 算法题 2:回文子串问题,使用动态规划(DP)解决。
  7. 反问环节。

饿了么 暑期实习 AIGC (KPI 凉经)

一面 (2024/3/28)

  1. 自我介绍。
  2. 项目经历:介绍快手推荐实习经历。
  3. 推荐系统:全链路过程讲解。
  4. 论文介绍:NeurIPS 论文内容。
  5. 本科项目:App 开发经历。
  6. AIGC/LLM 认知:对 AIGC 和大语言模型的了解程度及自学情况。
  7. AGI 观点:对 AGI 的看法,结合人类意识与人脑发展分析是否能达到。
  8. 预训练经验:是否有过大模型预训练上手经验。
  9. Attention 原理:Transformer 中 Attention 的具体原理及设计动机。
  10. LLM 训练流程:大语言模型训练的整体过程。
  11. RLHF:介绍强化学习人类反馈(Reinforcement Learning from Human Feedback)原理。
  12. DDPM:介绍去噪扩散概率模型(Denoising Diffusion Probabilistic Models)原理。
  13. NLP 发展:自然语言处理的大致发展流程。
  14. PyTorch 实战:最近遇到的 PyTorch Bug 及处理方式。
  15. 损失函数:PyTorch 中常见的损失函数。
  16. Agent 建议:面试官建议了解 LLM Agent,暗示匹配度不足。
  17. 反问环节:部门主要业务内容。 注:面试后官网职位下架,疑似 KPI 面试。

山水比德 AIGC

  1. 自我介绍。
  2. 应用场景:针对外景设计 AI 方案有哪些?
  3. 项目价值:项目对公司应用的具体帮助。
  4. 反问环节。 注:侧重应用端,技术要求相对较浅,HR 与技术共同面试。

网易 伏羲 大模型算法实习

一面 (36 分钟)

  1. 自我介绍。
  2. 项目拷打 1:论文项目,情绪流建模的必要性,为何不直接对比 ChatGPT。
  3. 项目拷打 2:RAG 项目,数据集构建细节,提升问答效果的方向。
  4. 场景题:
    • 对话场景中如何更好识别用户意图?
    • 如何设计个性可随意切换的问答系统?
  5. 反问环节:部门业务(与雷火合作,做智能 NPC)。 注:无算法题,偏重自由发挥与场景设计。

二面 (26 分钟速通)

  1. 自我介绍。
  2. 项目拷打 1:RAG 项目,团队分工,哪种优化方式提升指标最多。
  3. 项目拷打 2:论文项目,共享屏幕讲解论文,追问较少。
  4. 反问环节:确认部门业务(智能 NPC)。
  5. 入职信息:到岗时间、实习时长、其他 Offer 情况。 注:未涉及算法题,主管面试,体验较好。

好未来 大模型

  1. 自我介绍。
  2. 项目细节:具体模块细节深挖。
  3. 算法题:组合总和问题(Combination Sum),且无重复元素。
  4. 解码策略:贪心算法、随机采样等,部分候选人未答出。
  5. 模型对比:T5 模型与 BERT 的区别(项目中使用了 T5),Self-Attention 机制。
  6. RAG 技术:大模型检索增强生成相关知识。
  7. LLaMA 结构:LLaMA 具体架构细节。
  8. RLHF 技术:强化学习人类反馈技术。
  9. 微调经验:是否微调过大模型,具体流程讲解。 注:面试体验良好,已发 Offer。

面试核心知识点解析

为了帮助读者更好地准备此类面试,以下对文中高频出现的核心技术点进行补充解析。

1. Transformer 与位置编码

  • 整体结构:包含 Encoder 和 Decoder 堆叠,核心是 Self-Attention 和前馈神经网络(FFN)。
  • 位置编码:由于 Self-Attention 是置换不变的,需引入位置信息。常见方式包括绝对位置编码、相对位置编码以及 LLaMA 使用的旋转位置编码(RoPE)。RoPE 通过旋转矩阵将位置信息融入 Query 和 Key 向量,具有更好的外推性能。
  • 多头注意力:将输入投影到多个子空间并行计算注意力,最后拼接输出,增强了模型捕捉不同特征的能力。

2. 大模型训练流程

  • 预训练(Pre-training):在大规模无标注语料上训练,学习通用语言表示。
  • 监督微调(SFT):使用指令数据对模型进行微调,使其遵循指令。
  • RLHF:通过奖励模型(Reward Model)对人类偏好进行排序,利用 PPO 等算法优化策略模型,使输出更符合人类价值观。

3. RAG (检索增强生成)

  • 原理:当模型回答时,先从外部知识库检索相关信息,再将其作为上下文输入给大模型生成答案。
  • 优化方向:提高检索准确率(Embedding 模型选择、分块策略)、优化生成质量(Prompt 工程、混合检索)。

4. 扩散模型 (DDPM)

  • 前向过程:逐步向图像添加高斯噪声,直至变成纯噪声。
  • 反向过程:学习从噪声中恢复图像的逆向过程,用于文生图任务。

5. 常见算法题思路

  • 字符串旋转:判断 s1 是否为 s2 的子串且长度相同,若 s2 + s2 包含 s1 则成立(O(N)),但题目要求 O(1) 通常指空间复杂度,时间复杂度无法低于 O(N)。若指空间 O(1),可使用双指针模拟旋转。
  • 岛屿数量:典型的 BFS 或 DFS 连通性问题,遍历网格标记访问过的节点。
  • 回文子串:中心扩展法或动态规划。DP 状态定义为 dp[i][j] 表示 s[i..j] 是否为回文。
  • 组合总和:回溯算法,注意剪枝避免重复组合。

6. 模型对比

  • BERT vs T5:BERT 基于 Encoder 架构,主要用于理解任务(分类、抽取);T5 基于 Encoder-Decoder 架构,将 NLP 任务统一为文本到文本形式,更适合生成任务。
  • LLaMA:采用 SwiGLU 激活函数、RoPE 位置编码及 RMSNorm 归一化,提升了训练效率与推理性能。

目录

  1. AGI 大模型算法岗位面试经验汇总
  2. 字节跳动 暑期实习 多模态算法 (二面)
  3. 一面 (2024/3/28)
  4. 二面 (2024/4/8)
  5. 饿了么 暑期实习 AIGC (KPI 凉经)
  6. 一面 (2024/3/28)
  7. 山水比德 AIGC
  8. 网易 伏羲 大模型算法实习
  9. 一面 (36 分钟)
  10. 二面 (26 分钟速通)
  11. 好未来 大模型
  12. 面试核心知识点解析
  13. 1. Transformer 与位置编码
  14. 2. 大模型训练流程
  15. 3. RAG (检索增强生成)
  16. 4. 扩散模型 (DDPM)
  17. 5. 常见算法题思路
  18. 6. 模型对比
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 前端项目自动化部署最佳实践
  • 腾讯 AI 智能体对比:QClaw 与 WorkBuddy
  • C++11 新特性:可变参数模板、类功能与 STL 变化
  • 芋道项目部署:前端直连后端与 Nginx 反向代理对比
  • Windows 系统 Python 命令自动跳转商店的解决方案
  • AI 绘画报错:CheckpointLoaderSimple 模型缺失解决方案
  • 网络通讯核心协议:TCP、UDP 与 HTTP/HTTPS 详解
  • LangChain4j 集成国产大模型(通义千问、文心一言、智谱 AI)实战
  • Flutter 三方库 webdriver 的鸿蒙化适配指南
  • AI Agent 记忆系统:架构、范式与实战
  • MIT 电机模式控制:参数设置与调试指南
  • Claude Skills 实战指南:安装、使用与自定义开发
  • AG-UI:连接 AI 智能体与用户应用的开放协议
  • Codex Multi-Agent 与 Claude Agent Teams 架构对比与选型指南
  • 10 款主流 AI 办公软件推荐:涵盖表格、文档、PPT 及数据分析
  • 插件式架构实战:基于 C++ 与 C# 的软件解耦方案
  • 国内 AI 编程助手订阅套餐横评与选型指南
  • Faster-Whisper 本地实时语音识别部署实战
  • 基于 LLaMA-Factory 与 Stable Diffusion 的跨模态创作工作流
  • 前端多版本零 404 部署实践:根因分析与解决方案

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online