一句话总结 2026 年 3 月 28-29 日,AI 行业呈现 IPO 集中爆发(Anthropic、OpenAI、月之暗面、SpaceX)、模型能力密度跃升(Claude Mythos、GLM-5.1、Gemini 3.1 Flash Live)、具身智能标准落地与工业场景爆发、Token 经济学与推理成本优化成产业焦点,同时 NeurIPS 学术制裁事件引发全球 AI 治理与地缘政治争议。
一、模型与技术突破 1.1 通用大模型(大语言模型与多模态模型)
- Anthropic: Claude Mythos(内部代号 Capybara)泄露,规模与智能程度均超 Opus,编码/推理/网络安全能力显著提升,利用漏洞速度可能远超防御者应对努力,导致 CrowdStrike 等网络安全股下跌超 5%;调整 Claude 用量限制机制,引入"峰谷价"经济杠杆引导用户错峰使用,确保高负载期间服务稳定性。
- 智谱 AI: 发布 GLM-5.1,跑分全面碾压前代;推出 GLM-5-Turbo,针对特定场景深度优化,提升工业级应用任务完成率与精准度,但因计算成本增加调整价格,反映真实成本反对长期低价竞争。
- 谷歌:发布 Gemini 3.1 Flash Live,专为实时语音交互设计,支持 90 多种语言,延迟大幅降低,精准捕捉音高/语速/语气等声学细节,嘈杂场景下噪声过滤能力提升;推出 TurboQuant 极限压缩算法,KV Cache 压缩至每通道仅 3 比特,内存占用减少 6 倍,推理速度提升 8 倍,长上下文推理保持近无损精度,引发全球存储芯片股大幅下跌。
- 美团:开源 LongCat-Next 原生多模态大模型,将图像、语音与文本统一映射为离散 Token,实现视觉与语音原生统一处理,支持 100 万 Token 上下文,解码提速 10 倍,突破离散视觉建模性能瓶颈,为工业级基础模型。
- 月之暗面:Kimi K2.5 开源模型被 Cloudflare 采纳替代高成本闭源模型,应用于核心生产业务,年成本削减约 77%,日处理超 70 亿 Token,凭借 256k 超大上下文窗口与出色视觉/工具调用能力实现降本增效。
- 面壁智能:与华为在端侧 AI 领域深度合作,以"密度法则"为核心,通过算法/架构/数据优化降低 MiniCPM 系列模型时延并提升能效;联合清华团队在 Nature 子刊提出 Densing Law,模型能力密度约每 3.5 个月翻一倍,同等性能所需参数量每 3.5 个月减半。
- 字节/北大等机构:联合推出 Helios 大模型,14B 参数视频生成模型,单张 H100 显卡上以近 20FPS 速度运行并生成数分钟高质量视频,通过"首帧锚点"技术优化降低 AI 视频生成商业化门槛。
- 硅心科技:发布 aiX-apply-4B 专为企业代码变更设计的高性能轻量级模型,20 多种编程语言与文件格式测试准确率 93.8%,单张消费级显卡上实现比 DeepSeek-V3.2 快 15 倍的推理速度,显著降低企业算力成本。
- 深度机智:发布 PhysBrain 1.0,全球首个基于人类学习范式的通用智能基座模型,具备物理常识内化能力,从像素中学习因果关系。
- 清华/无问芯穹:发布 WideSeek-R1,4B 参数模型采用多智能体强化学习(MARL)与宽度扩展,在 20,000 个信息检索任务数据集上训练,广度信息搜索任务表现媲美 671B 参数 DeepSeek-R1,F1 分数 40.0%。
- 加州大学圣地亚哥分校:推出 AIBuildAI 智能体系统,OpenAI MLE-bench 评测以 63.11% 整体得分夺冠,自动完成模型设计、代码生成、训练、超参数调优及性能评估,简单任务准确率 77.27%。
- Meta: 开源 TRIBE v2 大脑基础模型,基于 700 多人脑部扫描数据训练,利用 500 多小时 fMRI 记录,分辨率提升 70 倍,支持对新受试者/语言/任务进行零样本预测,合成预测优于真实 fMRI 记录;提出超级智能体 HYPERAGENTS(达尔文哥德尔机),实现元认知自我修改,SWE-bench 性能从 20% 自动提升至 50%。
- 蚂蚁集团:联合上海交大发布 F2LLM-v2 系列 Embedding 模型,MTEB 榜单 11 项评测第一,覆盖 430 项任务,支持 282 种自然语言和 40 多种编程语言,全尺寸开源,打破"英语中心主义"壁垒。
- 苹果:与威斯康星大学麦迪逊分校发布 RubiCap 全新 AI 训练框架,专注"密集图像描述"任务,通过强化学习机制提升细节捕捉准确性,较低参数规模展现超越千亿大模型性能。
- 西湖大学/上海 AI 实验室等:提出 AI 虚拟代谢概念,通过 AI 与多组学数据深度融合,构建包含生物学约束过滤器的系统性工程,实现从单一生物合成路径设计扩展至整个细胞代谢网络动态模拟。
- 杨立昆团队:发布 LeWorldModel,1500 万参数单 GPU 数小时可训练,物理世界建模速度提升 48 倍,规划速度比基础模型快 48 倍,令牌使用量减少约 200 倍,潜在空间编码位置/速度等物理量。
- Cohere: 推出开源语音转录模型 Transcribe,参数量 20 亿,采用 Conformer 编码器解码器架构,支持 14 种语言,单词错误率 5.42%,在 Hugging Face 开源 ASR 排行榜位居第一,超越 Whisper Large v3。
- Mistral AI: 发布开源语音合成模型 Voxtral TTS,4B 参数基于 Ministral 3B 构建,支持 9 种语言,零样本克隆语音(仅需 3 秒参考音频),首字延迟约 90-100 毫秒,24kHz 高保真音频输出。
1.2 垂直大模型
- 蚂蚁数科:发布 Ling-DT-Fin-Mini-2.5 轻量级金融专用 MoE 模型,解决智能体产业落地 Token 消耗过高问题,结合大小模型以最优性价比解决高并发/低时延金融场景任务。

