大模型行业观察:特斯拉 Robotaxi 发布、OpenAI 动荡与芯片竞争
大模型梦碎的时间点似乎越来越近。过去一周,有关人工智能的消息糟糕多于积极。
周初,诺贝尔物理学奖和化学奖接连砸向时下正热的人工智能领域。这些奖项出人意料且鼓舞人心,意味着人工智能的确已经根本性地改变了我们生活和科学体系的方方面面。然而对于眼下基于大模型展开的众多人工智能生意,这些既有研究的帮助有限。
特斯拉在本周花了大价钱布置和渲染了一片颇具未来感的人机风情社区——在这个社区里,机器人负责取悦人类,它们开车、跳舞、招待顾客甚至陪人聊天,而人类负责吃喝玩乐,酒足饭饱后搭乘特斯拉刚刚发布的 Robotaxi(自动驾驶出租车)——Cybercab 离开。
一切看起来很美好,未来似乎已经在眼前,然而现场一阵狂欢后,特斯拉的股价却下跌了近 10%。冰冷现实提示我们,我们没有准备好的东西还有很多,从技术到监管,以及我们的各种组织形态本身。
自动驾驶还没有真的令人放心,大模型同样如此。坚持了 2 年后,Character AI 彻底放弃了自研大模型。它不会是唯一的一家,虽然没有明确说明,但此前已投入硅谷大厂怀抱的 Inflection AI、Adept、Covariant 等曾经的独角兽放弃这一昂贵又继续突破无望的工作是迟早的事。本周,有消息传出称国内也有两家此前的独角兽可能放弃自研大模型。这一消息尚未获得证实。
连一向引领行业的 OpenAI 也日益动荡。首席科学家 Ilya Sutskever 和首席技术官 Mira Murati 接连离开公司后,OpenAI 联创 Durk Kingma 和 Sora 负责人之一 Tim Brooks 也于本周离职,分别加入对手公司 Anthropic 和 DeepMind。10 月 1 日举办的 OpenAI 开发者大会上,OpenAI 没有任何新产品或新技术推出。Sora 迄今没有上线,GPT-5 也已很久没人提及。曾有传闻称苹果计划入股 OpenAI,但在最新一轮融资中,苹果消失得无影无踪。
本周关键动态概览
软件篇
- Character AI 放弃开发大模型;
- MiniMax 上线图生视频功能;
- Kimi 推出探索版,效仿 OpenAI o1 的分步推理;
- 纯鸿蒙系统开启公测。
硬件篇
- 特斯拉计划 2026 年推出 4 种自研电池,采用干法工艺;
- Waymo 同现代汽车合作生产 Robotaxi,此前曾与极氪合作;
- 特斯拉发布首款自动驾驶出租车 Cybercab;
- AMD 发布新款人工智能芯片 MI325X,与英伟达竞争;
- 字节发布首款 AI 硬件——一款可以呼唤大模型的耳机。
钱与人才流动
- OpenAI 联创 Durk Kingma 加入 Anthropic;
- Sora 负责人之一 Tim Brooks 加入 DeepMind;
- OpenAI 任命新的后训练主管,又有一名元老离职。
软件篇深度解析
Character AI 放弃开发大模型
10 月 2 日,Character.ai 新任临时首席执行官 Dominic Perella 表示,该公司已基本放弃与 OpenAI、亚马逊和 Google 等资金更雄厚的 AI 公司竞争,建立大型语言模型。相反,成立三年的 Character.ai 将专注于其更受欢迎的消费业务,即模拟各种人物和名人风格对话的聊天机器人,也包括由用户自己设计的聊天机器人。
Perella 表示,训练前沿模型的成本非常高,「即使是非常大的启动预算,也很难筹集到资金」。今年 8 月,Google 将 Character.ai 两位创始人与该公司 20% 的员工挖走,加入其人工智能部门 DeepMind,并支付 27 亿美元购买该初创公司模型的一次性许可。这笔交易为这家初创公司提供了足够运营 18 个月的资金,并补充说,该公司未来可能会寻求从风险投资中筹集资金,并寻求与其他公司达成类似的许可协议。
这一动向标志着垂直应用层厂商在通用大模型领域的退守,表明算力与数据门槛已成为中小厂商难以逾越的鸿沟。
MiniMax 上线图生视频功能
10 月 10 日,MiniMax 视频模型宣布上线图生视频功能,向该视频模型输入一张图片,它可以生成一段长达 6 秒的视频。今年 8 月 31 日,MiniMax 发布旗下第一个视频生成模型 abab-video-1,支持文生视频。当时,MiniMax 创始人闫俊杰在发布会后的采访中称,之后还将陆续推出「图生视频、文 + 图生成视频、可编辑的可控视频生成」等模型或功能。
这表明多模态生成能力正在快速迭代,从单一文本驱动向图文混合驱动演进,提升了内容创作的灵活性和可控性。
Kimi 推出探索版,效仿 OpenAI o1 的分步推理
10 月 11 日,月之暗面发布「Kimi 探索版」,通过将复杂问题分解为多步任务、在搜索过程中实现多步搜索,从而提升问题回答质量。月之暗面称,「Kimi 探索版」的搜索量是普通版的 10 倍,1 次搜索即可精读超过 500 个页面。


