2025 大模型行业现状与方向调研：LLM、MLLM 及 AIGC 赛道分析 | 极客日志

编程语言AI算法

2025 大模型行业现状与方向调研：LLM、MLLM 及 AIGC 赛道分析

2025 年大模型行业进入结构化竞争阶段，基座研发由巨头垄断，中小玩家转向应用落地。LLM 领域侧重工程化与微调，AIGC 聚焦商业化场景，MLLM 因技术壁垒高成为创新核心。岗位分为训练、推理、Infra 三类，训练岗门槛高且重科研，推理岗贴近业务，Infra 岗关注算力基建。后训练涉及 SFT、RLHF、DPO 等对齐技术，RAG 用于缓解幻觉。学术界需关注顶会顶刊如 ACL、CVPR 等。

Stephaine Walsh发布于 2026/3/23更新于 2026/5/2519 浏览

2025 年大模型行业现状与方向调研

1. 2025 大模型行业三大赛道：LLM/MLLM/AIGC

背景：

2025 年的大模型行业已告别'野蛮生长'，进入'结构化竞争'阶段。核心特征十分明确：基座模型研发被巨头垄断，中小玩家转向应用落地与细分技术突破。
全球范围内，OpenAI、Google、Meta 凭借算力集群、海量合规数据与顶尖算法团队，占据 LLM 基座模型的绝对主导地位；国内头部科技企业则通过'自研基座 + 行业适配'双线布局，形成区域竞争壁垒。
训练一个 SOTA 级 LLM 基座的成本已突破 10 亿美元，且需跨学科顶尖人才团队持续投入，'造模型'成为少数巨头的专属游戏。
行业创新重心正加速转移：纯 LLM 领域从'架构创新'转向'工程化落地'；多模态成为技术突破的核心战场，端侧部署、跨模态交互等场景的创新层出不穷；AIGC 的商业化进程进一步提速，从'概念验证'走向'规模化盈利'。

（1）纯语言大模型（LLM）：工程化深耕，分化明显

微调（Fine-tuning）：行业数据适配的核心手段，例如金融行业用监管合规数据微调基座模型。该方向技术流程日趋标准化，更考验从业者对行业数据的理解与工程落地经验。
检索增强生成（RAG）：LLM 应用的'标配能力'，几乎所有企业级 LLM 产品都已集成。当前核心挑战集中在工程优化——如何提升 embedding 的行业适配性、优化检索引擎的响应速度、降低生成内容的幻觉率。
Agent 开发：2025 年持续热门的应用方向，本质是'提示词工程 + 工具调用 + 基础规划逻辑'的组合。开发者更多是'场景设计者'而非'技术创造者'。
模型压缩、量化与部署：刚需且稳定的赛道，随着企业对 LLM 部署成本的敏感度提升，轻量化技术需求激增。该方向更偏向 MLOps 与模型工程，从业者需掌握 TensorRT、ONNX 等部署工具。
从业价值来看，LLM 领域岗位'下限高、天花板有限'，个人价值高度依赖所使用的基座模型。

（2）生成式模型（AIGC）：商业化落地为王，方差巨大

AIGC 在 2025 年已形成清晰的'业务导向'定位，聚焦具体场景的产品化落地。其核心特征是'技术封装化、岗位细分化'。
典型应用场景已从早期的'文生图、文生视频'拓展到垂直领域，例如营销行业的 AI 广告生成平台、教育行业的 AI 课件制作工具、编程领域的智能代码生成与调试助手等。
分工上，企业通常仅保留小团队负责模型微调与优化，大部分岗位为'应用算法工程师'或'后端工程师'，核心工作是将开源或第三方模型封装为 API，嵌入业务流程。
该赛道的核心优势是'离市场近、成果可见'，但短板也十分突出——对于志在核心算法的从业者，工作内容更偏向业务逻辑而非技术创新。

（3）多模态大模型（MLLM）：蛮荒之地的机遇，技术壁垒决定竞争力

2025 年的 MLLM 已成为大模型行业的'创新引擎'，被视为未来 5 年技术突破的核心方向。
技术价值：从'单一模态'到'真实世界交互'。人类认知世界的本质是多模态融合，而纯文本 LLM 无法理解物理世界的空间关系、视觉细节与声音信息。MLLM 的核心使命是解决'跨模态对齐'问题。
技术壁垒：复合型知识栈筛选优质人才。MLLM 对从业者的要求远超纯 LLM，不仅要精通 NLP 与 CV 的核心算法，还需掌握图形学、语音处理、视频压缩等跨学科知识。
这一案例印证了 MLLM 领域的核心逻辑：技术壁垒越高，职业竞争力越强，天花板越高。

2. 岗位分类，发展路径

2.1 职业方向对比（训练，推理，Infra）

对比维度	训练（算法岗、科研类）	推理（应用岗、科研&工程类）	AI-Infra（工程类）
核心定位	生产工具（模型创新与优化）	使用工具（业务场景落地）

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

细分岗位	核心定位	核心职责	核心技能要求	准入难度	典型产出
IaaS 运维与开发	硬件资源整合与调度	1. 服务器组装、集群组网与运维管理；2. 分布式存储系统搭建；3. 网络优化；硬件资源监控与故障排查	1. 计算机网络、操作系统（Linux）；2. 分布式存储技术；GPU 硬件知识；运维工具	★★★	可调度的算力集群、存储集群
PaaS 算子开发	计算效率优化核心	1. 底层算子开发（CUDA/Triton），优化模型训练 / 推理的核心计算单元；2. 算子融合、精度优化；适配不同硬件的算子移植	1. C/C++、CUDA 编程；深度学习计算原理；性能分析工具；并行计算知识	★★★★	高性能算子库、量化工具
PaaS 训练与推理框架开发	上层工具链支撑	1. 训练框架优化（如 PyTorch/DeepSpeed 二次开发）；2. 推理框架开发 / 优化（如 vLLM/TensorRT-LLM）；3. 框架与硬件的适配	1. Python/C++；深度学习框架内核理解；分布式系统设计；模型压缩、并行训练原理	★★★★	优化后的训练 / 推理框架
SaaS 推理服务开发	应用层部署与服务化	1. 模型部署工程化（容器化、Serverless 部署）；2. 推理服务集群搭建；3. 服务监控与熔断降级；4. 多模型统一调度与资源隔离	1. Docker/K8s 容器化技术；微服务架构；推理框架；云服务使用经验	★★★☆	高可用的推理服务 API、调度平台

什么是多模态大模型？核心挑战是什么？ 答案：融合文本、图像、音频等多种模态信息的模型，核心挑战是模态间异构性对齐与跨模态语义理解的一致性。
多模态模型的常见架构（如 Flamingo、BLIP-2）核心设计思路是什么？ 答案：通过桥接模块（如 Q-Former）将图像特征映射到语言模型的语义空间，实现模态对齐。
多模态预训练的常见任务有哪些？ 答案：图像文本对比学习（CLIP）、图文匹配、图像描述生成、跨模态掩码预测。
如何增强多模态模型的识别准确度（比如识别医疗手写表格的特征与具体值）？ 答案：1. 用领域内高质量标注数据做继续预训练/SFT；2. 加入空间注意力增强；3. 结合 OCR 模型先提取文本，再和图像特征融合；4. 用自监督学习做表格结构预训练。
手写多头注意力的计算步骤？ 答案：1. 输入嵌入分别线性变换得到 Q、K、V 矩阵；2. 对 Q、K 做缩放点积注意力计算相似度；3. 用 softmax 得到注意力权重；4. 权重与 V 相乘得到单头注意力输出；5. 拼接所有头的输出，再线性变换得到最终结果。
为什么计算注意力要除以维度的平方根（\sqrt{d_k}）？ 答案：避免高维度下 Q·K 的内积结果过大，导致 softmax 输出趋近于 one-hot，梯度消失，保证注意力分布更均匀。
decoder-only 结构（如 LLaMA）从输入 prompt 到输出 token 的完整过程？ 答案：1. 输入 prompt 做词嵌入 + 位置编码；2. 经过多层 decoder block（每层含掩码多头注意力+MLP），掩码保证当前 token 只关注前文；3. 顶层输出经线性层映射到词表维度；4. softmax 得到下一个 token 的概率分布；5. 采样生成 token 并拼接回输入，重复步骤 2-4 直至生成结束符。
有什么办法将 2 维的 embedding 转换成 3 维的 embedding，同时保留位置编码信息？ 答案：1. 增加维度映射层；2. 位置编码同步扩展；3. 用卷积层升维，利用卷积的参数共享特性保留原有语义和位置特征。
跨模态对齐如何做？你都了解哪些对齐方式？ 答案：1. 对比学习对齐（如 CLIP）；2. 生成式对齐（如 BLIP）；3. 桥接模块对齐（如 Q-Former）；4. 掩码重建对齐（如多模态 BERT）。
ROPE（旋转位置编码）给我介绍一下？ 答案：一种绝对位置编码，通过旋转矩阵将位置信息融入 query 和 key 的向量中，公式为 $q_{rot}=q \odot \cos(m\theta)+q_{\perp} \odot \sin(m\theta)$；优势是支持外推（长文本位置可直接计算），且能捕捉相对位置关系。
说一下 P-tuning 的原理？ 答案：一种软提示调优方法，冻结预训练模型权重，只训练少量可学习的软提示嵌入（virtual tokens）；将软提示插入输入序列，通过调整软提示来适配下游任务。

RLHF 的三大核心步骤是什么？详细流程讲一下？ 答案：步骤 1：有监督微调（SFT）；步骤 2：训练奖励模型（RM）；步骤 3：强化学习微调（PPO）。额外步骤：加入 KL 散度约束。
RLHF 的三个流程中你觉得哪个应该是最重要的？为什么？ 答案：训练奖励模型（RM）最重要；因为 RM 是人类偏好的'代言人'，RM 的打分质量直接决定最终模型的对齐效果。
奖励模型（RM）的作用是什么？训练时的关键注意事项？如何训练？训练到什么程度可以？ 答案：作用：对模型输出打分，衡量和人类偏好的对齐程度；训练注意事项：标注数据需一致性高、构建多样化正负样本、避免奖励崩塌；训练方法：收集模型输出的排序样本，用排序损失（Pairwise Ranking Loss）训练；停止标准：验证集上的排序准确率稳定。
Reward model 不准确怎么办？ 答案：1. 重新标注高质量数据；2. 迭代优化 RM；3. 加入正则化；4. 多 RM 融合；5. 引入辅助损失。
为啥 RLHF 中要用 PPO？和其他 RL 算法的区别？ 答案：PPO 的核心优势是信任域（Trust Region）限制，通过裁剪策略梯度，避免模型参数更新幅度过大；与其他 RL 算法区别：相比 TRPO 实现更简单，相比 DQN 适合连续动作空间，相比 A2C 支持离线数据训练。
PPO 的原理？ 答案：一种近端策略优化算法，核心是最大化'裁剪后的优势函数'；步骤：1. 用当前策略收集数据，计算动作的优势值；2. 计算新旧策略的概率比值，裁剪该比值到 [1-ε, 1+ε] 区间；3. 交替执行'采样数据→更新策略'。
PPO 是倾向于将模型往什么方向训练？ 答案：倾向于在人类偏好的方向上渐进优化，同时通过 KL 散度约束，保证模型不会偏离有监督微调的初始模型太远。
在用 vLLM 做强化学习时，你是根据什么指标来查看训练的进度的？ 答案：1. 奖励分数；2. KL 散度；3. 策略梯度的方差；4. 下游任务指标；5. 推理速度/吞吐率。
什么是 RLAIF？解决了 RLHF 的什么问题？ 答案：用 AI 标注替代人类标注的强化学习对齐方法；解决了 RLHF 中人类标注成本高、规模小、一致性差的问题。
多模态 RLHF 的难点是什么？ 答案：多模态输出的奖励难以量化、跨模态反馈信号的稀疏性、模态间对齐和偏好对齐的双重目标。
什么是对齐税（Alignment Tax）？如何缓解？ 答案：模型对齐后任务性能下降的现象；缓解方法是在 RL 阶段加入预训练损失（KL 散度约束），平衡对齐和性能。
DPO 了解吗？DPO 和 PPO 有什么区别？你更喜欢使用哪种？ 答案：DPO 是直接偏好优化，一种无需训练奖励模型的对齐算法；区别：流程上 DPO 省去 RM 训练步骤；稳定性上 DPO 鲁棒性更强；计算开销上 DPO 更快；偏好：DPO，因为流程更简洁、超参数更少、训练效率更高。
DPO 的公式给我写一下或者口述一下？ 答案：核心是最小化负对数似然损失，目标函数为：$L_{DPO}(\pi_{\theta}) = -\mathbb{E}{(x,y_w,y_l)\sim D}[\log\sigma(\beta(\log\frac{\pi{\theta}(y_w|x)}{\pi_{ref}(y_w|x)} - \log\frac{\pi_{\theta}(y_l|x)}{\pi_{ref}(y_l|x)}))]$。
DPO 跟对比学习有哪些相同点和不同点？ 答案：相同点：都依赖成对样本；都通过相对比较优化模型。不同点：目标不同，对比学习是最大化同类相似度，DPO 是最大化偏好输出的概率；应用场景不同；模型输入不同。
Reward 有多个目标可以怎么做？ 答案：1. 多奖励模型融合；2. 分层奖励设计；3. 多目标优化算法；4. 在 RM 训练中加入多目标标注。
Reward model 和训练的 LLM 模型用同一个基座模型可能有什么作用？ 答案：1. 降低训练开销；2. 提升特征一致性；3. 支持参数共享；4. 便于迁移优化。
如何提升 RLHF 的效率？你认为关键在哪里？ 答案：提升方法：1. 用 Lora/QLoRA 降低训练参数量；2. 采用离线 RL；3. 优化 RM 训练；4. 分布式训练；关键在于提升数据利用效率和降低计算开销。

框架/工具	核心定位	分布式能力（LLM 场景）	优点	缺点	典型使用场景
原生 PyTorch	基础张量计算/分布式底层	支持 DDP、TP（需手动实现）、PP（需手动写逻辑）	灵活性最高，可定制所有细节	分布式代码开发成本高	自研大模型框架、极致定制化训练需求
Hugging Face Accelerate	PyTorch 分布式训练封装层	一键适配 DDP/FSDP，支持多卡/多节点	轻量化，无侵入式适配现有 PyTorch 代码	仅封装基础分布式逻辑	中小规模 LLM（10B 以内）的 SFT/预训练
Hugging Face Trainer	端到端训练封装	基于 Accelerate 实现分布式，内置训练流程	开箱即用，无需写训练循环	灵活性低，复杂分布式策略难定制	快速验证算法、中小模型微调
PyTorch Lightning	训练流程工程化封装	封装 DDP/FSDP，支持多节点训练	代码模块化，易维护，适配多硬件	模型并行（TP/PP）需依赖第三方扩展	企业级 LLM 训练，注重工程化/可维护性
Ray（Ray Train）	分布式计算框架	支持 DDP/FSDP，可对接 PyTorch/TensorFlow	适配大规模集群，支持异构硬件	学习成本略高	超大规模 LLM 分布式训练/推理、集群调度

会议简称	英文全名	中文译名	主要领域定位	录用率参考（近年）
ACL	Annual Meeting of the Association for Computational Linguistics	计算语言学协会年会	自然语言处理（NLP）核心领域	21.4%
IJCAI	International Joint Conference on Artificial Intelligence	国际人工智能联合会议	人工智能综合领域	14.0%
ICML	International Conference on Machine Learning	国际机器学习大会	机器学习全领域	27.5%
AAAI	AAAI Conference on Artificial Intelligence	美国人工智能协会年会	人工智能综合领域	23.7%
CVPR	IEEE/CVF Conference on Computer Vision and Pattern Recognition	计算机视觉与模式识别会议	计算机视觉核心领域	22.1%
ICCV	IEEE International Conference on Computer Vision	国际计算机视觉大会	计算机视觉前沿与基础研究	26.2%
NeurIPS	Conference on Neural Information Processing Systems	神经信息处理系统大会	人工智能与机器学习顶尖会议	25.8%

序号	刊物简称	英文全称	出版社	文章侧重
1	AI	Artificial Intelligence	Elsevier	人工智能基础理论、自动推理、认知建模
2	TPAMI	IEEE Transactions on Pattern Analysis and Machine Intelligence	IEEE Computer Society	计算机视觉、模式识别、机器学习
3	IJCV	International Journal of Computer Vision	Springer	计算机视觉基础理论与前沿方法
4	JMLR	Journal of Machine Learning Research	Microtome Publishing	机器学习全领域

2025 大模型行业现状与方向调研：LLM、MLLM 及 AIGC 赛道分析

2025 年大模型行业现状与方向调研

1. 2025 大模型行业三大赛道：LLM/MLLM/AIGC

（1）纯语言大模型（LLM）：工程化深耕，分化明显

（2）生成式模型（AIGC）：商业化落地为王，方差巨大

（3）多模态大模型（MLLM）：蛮荒之地的机遇，技术壁垒决定竞争力

2. 岗位分类，发展路径

2.1 职业方向对比（训练，推理，Infra）

更多推荐文章

相关免费在线工具

2.2 职业方向细分（训练，推理，Infra）

3. 后训练 RL - 多模态方向

3.1 工业界（多模态基础、SFT、RL、RAG、分布式、场景）

（1）多模态基础与优化

（2）后训练（SFT/继续预训练）

（3）强化学习与模型对齐（RLHF/RLAIF/DPO）

（4）RAG 与模型幻觉

（5）工程部署与分布式训练

（6）项目场景题

3.2 学术界

（1）会议：CCFA - 人工智能 - 共 7 本

（2）期刊：CCFA-人工智能 - 共 4 本

（3）学者：AI2000，ORCID，Google Scholar，DBLP，OpenReview

更多推荐文章

相关免费在线工具

2025 大模型行业现状与方向调研：LLM、MLLM 及 AIGC 赛道分析

2025 年大模型行业现状与方向调研

1. 2025 大模型行业三大赛道：LLM/MLLM/AIGC

（1）纯语言大模型（LLM）：工程化深耕，分化明显

（2）生成式模型（AIGC）：商业化落地为王，方差巨大

（3）多模态大模型（MLLM）：蛮荒之地的机遇，技术壁垒决定竞争力

2. 岗位分类，发展路径

2.1 职业方向对比（训练，推理，Infra）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 职业方向细分（训练，推理，Infra）

3. 后训练 RL - 多模态方向

3.1 工业界（多模态基础、SFT、RL、RAG、分布式、场景）

（1）多模态基础与优化

（2）后训练（SFT/继续预训练）

（3）强化学习与模型对齐（RLHF/RLAIF/DPO）

（4）RAG 与模型幻觉

（5）工程部署与分布式训练

（6）项目场景题

3.2 学术界

（1）会议：CCFA - 人工智能 - 共 7 本

（2）期刊：CCFA-人工智能 - 共 4 本

（3）学者：AI2000，ORCID，Google Scholar，DBLP，OpenReview

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具