一句话总结 2026 年 3 月 28-29 日,AI 行业呈现 IPO 集中爆发(Anthropic、OpenAI、月之暗面、SpaceX)、模型能力密度跃升(Claude Mythos、GLM-5.1、Gemini 3.1 Flash Live)、具身智能标准落地与工业场景爆发、Token 经济学与推理成本优化成产业焦点,同时 NeurIPS 学术制裁事件引发全球 AI 治理与地缘政治争议。
一、模型与技术突破
1.1 通用大模型(大语言模型与多模态模型)
- Anthropic: Claude Mythos(内部代号 Capybara)泄露,规模与智能程度均超 Opus,编码/推理/网络安全能力显著提升;调整用量限制机制,引入"峰谷价"经济杠杆引导用户错峰使用。
- 智谱 AI: 发布 GLM-5.1,跑分全面碾压前代;推出 GLM-5-Turbo,针对特定场景深度优化,因计算成本增加调整价格。
- 谷歌: 发布 Gemini 3.1 Flash Live,专为实时语音交互设计,支持 90 多种语言;推出 TurboQuant 极限压缩算法,KV Cache 压缩至每通道仅 3 比特,内存占用减少 6 倍,推理速度提升 8 倍。
- 美团: 开源 LongCat-Next 原生多模态大模型,将图像、语音与文本统一映射为离散 Token,支持 100 万 Token 上下文,解码提速 10 倍。
- 月之暗面: Kimi K2.5 开源模型被 Cloudflare 采纳替代高成本闭源模型,应用于核心生产业务,年成本削减约 77%。
- 面壁智能: 与华为在端侧 AI 领域深度合作,提出 Densing Law,模型能力密度约每 3.5 个月翻一倍。
- 字节/北大等机构: 联合推出 Helios 大模型,14B 参数视频生成模型,单张 H100 显卡上以近 20FPS 速度运行。
- 硅心科技: 发布 aiX-apply-4B 专为企业代码变更设计的高性能轻量级模型,单张消费级显卡上实现比 DeepSeek-V3.2 快 15 倍的推理速度。
- 深度机智: 发布 PhysBrain 1.0,全球首个基于人类学习范式的通用智能基座模型。
- 清华/无问芯穹: 发布 WideSeek-R1,4B 参数模型采用多智能体强化学习(MARL),广度信息搜索任务表现媲美 671B 参数 DeepSeek-R1。
- 加州大学圣地亚哥分校: 推出 AIBuildAI 智能体系统,自动完成模型设计、代码生成、训练及评估。
- Meta: 开源 TRIBE v2 大脑基础模型,基于 700 多人脑部扫描数据训练;提出超级智能体 HYPERAGENTS,实现元认知自我修改。
- 蚂蚁集团: 联合上海交大发布 F2LLM-v2 系列 Embedding 模型,MTEB 榜单 11 项评测第一,全尺寸开源。
- 苹果: 与威斯康星大学麦迪逊分校发布 RubiCap 全新 AI 训练框架,专注"密集图像描述"任务。
- 西湖大学/上海 AI 实验室等: 提出 AI 虚拟代谢概念,构建包含生物学约束过滤器的系统性工程。
- 杨立昆团队: 发布 LeWorldModel,1500 万参数单 GPU 数小时可训练,物理世界建模速度提升 48 倍。
- Cohere: 推出开源语音转录模型 Transcribe,参数量 20 亿,在 Hugging Face 开源 ASR 排行榜位居第一。
- Mistral AI: 发布开源语音合成模型 Voxtral TTS,4B 参数基于 Ministral 3B 构建,零样本克隆语音仅需 3 秒参考音频。
1.2 垂直大模型
- 蚂蚁数科: 发布 Ling-DT-Fin-Mini-2.5 轻量级金融专用 MoE 模型,解决智能体产业落地 Token 消耗过高问题。
- 天工 AI(昆仑万维): 发布"3+1"生态架构,包括 AI 游戏世界模型、AI 视频大模型和 AI 音乐大模型。
- 首钢/中国一汽: 联合研发全球首款 2.4GPa 级热成形钢,应用于车门防撞梁等部件实现减重。
- 大连理工大学: 研发"瓷刚铝"新型铝基复合材料,通过"声场谐振干预"技术使纳米陶瓷粒子弥散化分布。

