核心摘要
全球 AI 领域密集发布技术、产品、企业动态,覆盖通用/垂直大模型、专项技术、智能体、机器人、硬件基建等全赛道。中国 AI 在视频、音乐、办公智能体领域领跑,OpenAI 关停 Sora 战略转型,Arm、苹果、腾讯等大厂新品落地,开源生态爆发同时供应链安全事件频发,行业向生产力、AGI、机器人方向聚焦。
一、模型与技术突破
1.1 通用大模型(大语言与多模态)
- Arm:推出首款自研 Arm AGI CPU,台积电 3nm 工艺,136 核 Neoverse V3 架构,主频 3.7GHz,TDP 300W,专为 AI 智能体基础设施打造;单机架性能达 x86 平台 2 倍以上,支持风冷 8160 核/液冷 45000 核部署,每 GW 算力节省百亿美元资本支出;Meta 联合开发,50 余家企业支持,年底量产,预判智能体 CPU 市场 TAM 达千亿美元。
- 苹果:测试独立 Siri App(代号 Campo),随 iOS 27 亮相,签约谷歌 1.2 万亿参数定制 Gemini 模型,模块化架构可替换引擎;从被动助手转为主动工具,取代 Spotlight 成统一搜索入口,嵌入 Dynamic Island,支持选字直接提问、键盘顶部写作调用。
- Anthropic:Opus 4.6 模型能力增强,移除 sprint 结构与上下文重置,架构大幅简化。
- Luma AI:发布 Uni-1 图像模型,单解码器自回归 Transformer 架构,统一图像理解与生成;RISEBench 推理得分超越 Nano Banana 2、GPT Image 1.5,2K 分辨率生成 0.09 美元/张,成本比谷歌低 11%-33%。
- 阿里通义:开源 Qwen3.5 视觉语言模型;推出 PrismAudio 视频转音频框架,首次融合强化学习与分解式思维链,四维 CoT 模块实现多维度优化。
- 美团龙猫:开源 LongCat-Flash-Prover 数学定理证明模型,5677 亿参数 MoE 架构,聚焦 Lean4 形式化推理,MiniF2F 测试通过率 97.1%,竞赛级任务表现领先开源模型,自研语法分析器排查 9 种 AI 作弊手段。
- 昆仑万维:Mureka V8 AI 音乐模型,获 Artificial Analysis 音乐榜人声、器乐双料第一,不到两年迭代实现'可直接发布'。
- JoyAI:LLM Flash 混合专家模型,3 亿激活参数、48 亿总参数,Muon 优化器训练,适配高吞吐、低延迟应用。
- 英伟达:发布 Nemotron 3 Super 模型;推出 MGX ETL 开放标准化机架,支持混合部署 AI 芯片。
- 阿里达摩院:玄铁 C950 CPU(RISC-V 架构),SPECint2006 单核性能破 70 分,原生支持千亿参数大模型,适配云计算与 AI Agent 场景。
- Soul AI:开源 SoulX-LiveAct 数字人实时生成模型,邻域强制+ConvKV 记忆机制,双 H100 实现 20FPS 无限时长流式推理,解决显存爆炸与动作漂移问题。
- 小米:发布 MiMo-V2-Pro、Omni 大模型,与五大 Agent 框架合作,向全球开发者提供一周免费 API。
- MiniMax:M2.7 模型搭配 Office Skills 效果最优;M2.5 模型优化推理架构,以更少 Token 完成任务,全球大模型调用量榜首。
1.2 垂直大模型
- 南加州大学:开源Ψ₀(Psi-Zero)人形机器人基座模型,分阶段训练,三层解耦架构(Qwen3-VL-2B 视觉大脑、5 亿参数 MM-DiT 动作专家、强化学习运动控制器),43 自由度全身控制,八项任务成功率超 NVIDIA GR00T N1.6 超 40%,训练数据仅为基线十分之一。
- 至简动力 + 北大 + 港中文:DeepVision-VLA 视觉增强框架,提升 VLA 模型视觉泛化能力 18%,RLBench 模拟器成功率 83%、真实世界 91.7%。
- 中科院计算所:SparseRL 深度强化学习框架,自动生成稀疏 CUDA 代码,SpMV 任务编译成功率 +20%、执行速度 +30%,入选 ICLR 2026 Oral。
- 医疗:CureWise 多智能体 AI 医疗平台,辅助罕见浆细胞疾病确诊。
1.3 专项技术突破
- KV 缓存优化:中科大 DefensiveKV(两行代码提升压缩鲁棒性);Delta-KV(视频压缩思路,量化误差降万倍,解码速度 +10%);FoveatedKV(VR 注视点渲染,Mac 端 7B 模型推理提速 2.3 倍);东方理工 HiDrop(压缩 90% 视觉 Token,2.2 倍加速,性能保有 98.3%)。

