2026 年 3 月,AI 领域正处于技术爆发与规模化落地并行的关键阶段。通用大模型向轻量化演进,垂直模型深耕细分场景,智能体生态从个人工具向企业级解决方案延伸,硬件与基础设施协同升级,安全合规成为必备能力。
一、模型与技术突破
1.1 通用大模型
- OpenAI:发布 GPT-5.4 mini 和 nano 轻量模型。mini 在 SWE-Bench Pro 编码测试达 54.4%,OSWorld 计算机使用达 72.1%,输入成本仅为旗舰版的 1/3;nano 面向免费用户开放,聚焦低延迟任务。提出'大模型决策 + 小模型执行'架构,长上下文处理仍是短板。
- MiniMax:发布 M2.7 大模型,参数量超 1T,支持 1M 超长上下文。SWE-Pro 编码得分 56.22%,原生 Agent Teams 多智能体协作可自主迭代超 100 轮。GDPval-AA 专业办公 ELO 得分 1500,同步开源互动娱乐框架 OpenRoom。
- 小米:发布 MiMo 系列三款模型,含旗舰基座 MiMo-V2-Pro(混合稀疏专家结构)、全模态理解 MiMo-V2-Omni 及端到端语音模型 MiMo-V2-TTS。上线 Xiaomi MiMo Claw 开放免费体验。
- 月之暗面:披露 Kimi K2.5 技术路线,研发 MuonClip 优化器提升 Token 效率,采用 Kimi Linear 混合线性注意力架构,引入编排器实现多智能体并行任务执行。
- DeepSeek:官网披露 V4 大模型计划 4 月发布,以 AI 编程为核心突破方向,参数达万亿级别。网传神秘国产模型现身开发者平台,中文推理表现亮眼。
- 腾讯:宣布混元 3.0 定档 4 月发布,较 2.0 在推理效率与智能体执行能力显著提升。开源紧凑多模态模型 Penguin-VL,视觉编码器重新设计,代码已在 GitHub 和 Hugging Face 开放。
- Google:Gemini 安卓应用测试版新增图像标记工具与对话式局部编辑功能。Gemini API 更新,允许单次调用组合内置与自定义工具,新增 Google Maps 地理定位能力。
- MiroMind AI:发布 MiroThinker-1.7 系列及 H1 模型,强调推理可验证性。F1 上海站预测结果完全一致,BrowseComp 等评测刷新最高成绩,开源 235B 与 30B 尺寸。
- 其他:DeepGen 1.0 开源,整合图像生成与推理功能;百度发布千帆 OCR 4B 模型,权重已上传 Hugging Face;社区开发者推出 Omnicoder 模型,基于 Qwen 3.5 9B 架构。
1.2 垂直大模型
- MBZUAI 联合团队:发布 scLong 单细胞基础模型,基于 4800 万个细胞预训练,在遗传扰动预测等任务优于现有模型。
- 清华大学 AIR&水木分子:开源 BioMedGPT-Mol 化学分子通用基座模型,降低药物研发领域 AI 应用门槛。
- 东风汽车:自主研发'东风太极大模型'体系,通过生成式人工智能服务备案,赋能汽车全生命周期。
- 小鹏汽车:发布第二代 VLA 大模型,耗资 20 亿重构辅助驾驶系统,不依赖高精地图。车端图灵芯片推理延时降至 80 毫秒,喀什到上海路考全程零接管。
- 日本乐天:发布 Rakuten AI 3.0,基于 DeepSeek-V3 架构微调,在日语文化知识维度表现优异。
1.3 专项技术突破
- 中山大学&MBZUAI:提出 ProPhy 框架,使视频生成模型具备分层物理理解能力。
- 机器之心:发布 MSA 稀疏潜在记忆框架,长上下文范围内性能衰减小于 9%。
- 其他:A2A_Flow_Matching 流匹配策略用于机器人操作模仿学习;FluidWorld 世界模型弃用 Attention 机制;MLRA 架构解码速度提升 2.8 倍;LiTo 模型通过单张平面图像重建完整 3D 对象。
1.4 AI 框架
- 香港大学 HKUDS:开源 CLI-Anything 项目,以 CLI 为桥梁解决 AI Agent 与专业软件交互难题,GitHub 斩获 18.6K Star。
- 开源框架:HIVE Engine 基于 Rust 原生 ReAct 循环;Zora 智能体框架默认零权限访问;DinTal Claw 适配国产大模型与政务专网;Flotilla 多智能体编排工具;PlanckClaw 运行时仅 6832 字节。

