大模型行业观察:特斯拉 Robotaxi 发布、OpenAI 动荡与芯片竞争
大模型梦碎的时间点似乎越来越近。过去一周,有关人工智能的消息糟糕多于积极。
周初,诺贝尔物理学奖和化学奖接连砸向时下正热的人工智能领域。这些奖项出人意料且鼓舞人心,意味着人工智能的确已经根本性地改变了我们生活和科学体系的方方面面。然而对于眼下基于大模型展开的众多人工智能生意,这些既有研究的帮助有限。
特斯拉在本周花了大价钱布置和渲染了一片颇具未来感的人机风情社区——在这个社区里,机器人负责取悦人类,它们开车、跳舞、招待顾客甚至陪人聊天,而人类负责吃喝玩乐,酒足饭饱后搭乘特斯拉刚刚发布的 Robotaxi(自动驾驶出租车)——Cybercab 离开。
一切看起来很美好,未来似乎已经在眼前,然而现场一阵狂欢后,特斯拉的股价却下跌了近 10%。冰冷现实提示我们,我们没有准备好的东西还有很多,从技术到监管,以及我们的各种组织形态本身。
自动驾驶还没有真的令人放心,大模型同样如此。坚持了 2 年后,Character AI 彻底放弃了自研大模型。它不会是唯一的一家,虽然没有明确说明,但此前已投入硅谷大厂怀抱的 Inflection AI、Adept、Covariant 等曾经的独角兽放弃这一昂贵又继续突破无望的工作是迟早的事。本周,有消息传出称国内也有两家此前的独角兽可能放弃自研大模型。这一消息尚未获得证实。
连一向引领行业的 OpenAI 也日益动荡。首席科学家 Ilya Sutskever 和首席技术官 Mira Murati 接连离开公司后,OpenAI 联创 Durk Kingma 和 Sora 负责人之一 Tim Brooks 也于本周离职,分别加入对手公司 Anthropic 和 DeepMind。10 月 1 日举办的 OpenAI 开发者大会上,OpenAI 没有任何新产品或新技术推出。Sora 迄今没有上线,GPT-5 也已很久没人提及。曾有传闻称苹果计划入股 OpenAI,但在最新一轮融资中,苹果消失得无影无踪。
本周关键动态概览
软件篇
- Character AI 放弃开发大模型;
- MiniMax 上线图生视频功能;
- Kimi 推出探索版,效仿 OpenAI o1 的分步推理;
- 纯鸿蒙系统开启公测。
硬件篇
- 特斯拉计划 2026 年推出 4 种自研电池,采用干法工艺;
- Waymo 同现代汽车合作生产 Robotaxi,此前曾与极氪合作;
- 特斯拉发布首款自动驾驶出租车 Cybercab;
- AMD 发布新款人工智能芯片 MI325X,与英伟达竞争;
- 字节发布首款 AI 硬件——一款可以呼唤大模型的耳机。
钱与人才流动
- OpenAI 联创 Durk Kingma 加入 Anthropic;
- Sora 负责人之一 Tim Brooks 加入 DeepMind;
- OpenAI 任命新的后训练主管,又有一名元老离职。
软件篇深度解析
Character AI 放弃开发大模型
10 月 2 日,Character.ai 新任临时首席执行官 Dominic Perella 表示,该公司已基本放弃与 OpenAI、亚马逊和 Google 等资金更雄厚的 AI 公司竞争,建立大型语言模型。相反,成立三年的 Character.ai 将专注于其更受欢迎的消费业务,即模拟各种人物和名人风格对话的聊天机器人,也包括由用户自己设计的聊天机器人。
Perella 表示,训练前沿模型的成本非常高,「即使是非常大的启动预算,也很难筹集到资金」。今年 8 月,Google 将 Character.ai 两位创始人与该公司 20% 的员工挖走,加入其人工智能部门 DeepMind,并支付 27 亿美元购买该初创公司模型的一次性许可。这笔交易为这家初创公司提供了足够运营 18 个月的资金,并补充说,该公司未来可能会寻求从风险投资中筹集资金,并寻求与其他公司达成类似的许可协议。
这一动向标志着垂直应用层厂商在通用大模型领域的退守,表明算力与数据门槛已成为中小厂商难以逾越的鸿沟。
MiniMax 上线图生视频功能
10 月 10 日,MiniMax 视频模型宣布上线图生视频功能,向该视频模型输入一张图片,它可以生成一段长达 6 秒的视频。今年 8 月 31 日,MiniMax 发布旗下第一个视频生成模型 abab-video-1,支持文生视频。当时,MiniMax 创始人闫俊杰在发布会后的采访中称,之后还将陆续推出「图生视频、文 + 图生成视频、可编辑的可控视频生成」等模型或功能。
这表明多模态生成能力正在快速迭代,从单一文本驱动向图文混合驱动演进,提升了内容创作的灵活性和可控性。
Kimi 推出探索版,效仿 OpenAI o1 的分步推理
10 月 11 日,月之暗面发布「Kimi 探索版」,通过将复杂问题分解为多步任务、在搜索过程中实现多步搜索,从而提升问题回答质量。月之暗面称,「Kimi 探索版」的搜索量是普通版的 10 倍,1 次搜索即可精读超过 500 个页面。
根据月之暗面介绍,「Kimi 探索版」与普通版有 3 个方面的差异。首先,在答题之前,「Kimi 探索版」可以预先规划解决问题的整体策略,将复杂问题分解为层次化的子问题、建立任务结构,然后分步执行;其次,「Kimi 探索版」可以一次并行搜索几十个不同的关键词,筛选和阅读几百个权威信息源;最后,「Kimi 探索版」具备反思能力,可以改善回答质量,例如在反思后主动补充回答更多信息。
这种长上下文处理与思维链(Chain of Thought)能力的结合,是当前大模型解决复杂逻辑问题的关键方向。
纯鸿蒙系统开启公测
10 月 8 日,华为宣布原生鸿蒙操作系统 HarmonyOS NEXT 正式开启公测,首批公测机型包括华为 Mate 60 系列、华为 Mate X5 系列和华为 MatePad Pro 13.2 英寸系列。华为今年 1 月推出 HarmonyOS NEXT 系统的开发者预览版,并表示该系统将只能安装为鸿蒙开发的原生应用,不再兼容安卓应用。
今年 6 月,华为宣布 HarmonyOS NEXT 首次将 AI 融入系统,推出 Harmony Intelligence(鸿蒙原生智能),依托昇腾的算力和盘古大模型,提供系统级的 AI 能力。目前,已有超 1 万个应用和元服务上架 HarmonyOS NEXT 应用市场,包括美团、小红书、钉钉、微博等。此前在适配鸿蒙系统方面进展缓慢的腾讯系应用也有了新进展,10 月 12 日,鸿蒙版微信加入公测。
鸿蒙系统的独立化意味着端侧 AI 部署的新机遇,本地化大模型运行将成为提升用户体验的重要路径。
硬件篇深度解析
特斯拉计划 2026 年推出 4 种自研电池,采用干法工艺
10 月 3 日,有报道称,特斯拉内部同时启动了 4 个新版本的 4680 电池项目,并计划在 2026 年推出 4 款新电池,新电池代号为 NC05、NC20、NC30 和 NC50(NC 代表新电池)。其中,NC05 为「主力」,将用于自动驾驶出租车 Robotaxi 和电动卡车 Cybertruck 等;NC20 预计用于 SUV 和 Cybertruck;NC30 预计用于 Cybertruck 以及未来一款全电动轿车;NC50 将专注于性能跑车。
干法电极工艺是电池制造的关键技术革新,能显著降低能耗和生产成本,对提升电动车续航和盈利能力至关重要。
Waymo 同现代汽车合作生产 Robotaxi,此前曾与极氪合作
10 月 4 日,有报道称,Google 旗下的自动驾驶子公司 Waymo 与韩国汽车制造商现代汽车达成了战略合作伙伴关系。现代汽车的 IONIQ 5 车型将集成 Waymo 第 6 代完全自动驾驶技术 Waymo Driver,并在美国佐治亚州的现代汽车工厂完成组装。搭载 Waymo Driver 的 IONIQ 5 将于明年年底开始初步路测。
双方还计划将相关车辆部署在 Waymo 的无人驾驶出租车服务网络 Waymo One 上。据称,Waymo 将购买并拥有这些车辆。早在 2021 年年底,吉利旗下的极氪就获得了 Waymo 第 6 代自动驾驶汽车的生产定点,车型与极氪 MIX(俗称「宝宝巴士」)同源。今年 6 月,Waymo 宣布第 6 代车型已在美国开启路测。而现代汽车成为 Waymo 新的合作伙伴,或与美国商务部的新禁令有关。半个月前,美国商务部提议禁止美国道路上的智能网联汽车、自动驾驶汽车使用来自中国的关键软件和硬件。
地缘政治因素正在重塑全球自动驾驶供应链的合作格局。
特斯拉发布首款自动驾驶出租车 Cybercab
当地时间 10 月 10 日晚间,特斯拉发布旗下首款自动驾驶出租车 Cybercab 和自动驾驶客货车 Robovan。两款产品设计都相当激进,其中 Cybercab 没有后车窗,车门像蝴蝶翅膀一样向上打开,只有 2 个座位,采用感应充电。
而与传统汽车和其他厂商的 Robotaxi 最大的不同在于,Cybercab 是一款专门为自动驾驶设计的车——负责开车的是 AI,车内甚至没有方向盘和踏板。这款车预计售价低于 3 万美元,预计 2026 年或 2027 年量产。
专用车型的推出标志着自动驾驶从改装阶段迈向原生设计阶段,有望大幅降低运营成本。
AMD 发布新款人工智能芯片 MI325X,与英伟达竞争
10 月 10 日,AMD 在旧金山举办的一次活动中宣布推出一款新款人工智能芯片 Instinct MI325X,对标英伟达的 Blackwell 系列。此外,AMD 还计划将于 2025 年下半年发布下一代 MI350 系列芯片,提升内存容量和底层架构,比之前的 MI300X 和 MI250X 芯片显著提高性能。
AMD 声称,MI325X 将比英伟达 H200 GPU 的能力提高 1.8 倍,在人工智能训练方面能力相近或高出 10%。MI325X 最早将在今年四季度量产出货,并在明年一季度通过戴尔、Eviden、技嘉、惠普企业、联想等服务器制造商更广泛地提供。
GPU 市场的竞争加剧有助于打破垄断,降低 AI 基础设施成本。
字节发布首款 AI 硬件——一款可以呼唤大模型的耳机
10 月 11 日,字节跳动在没有召开发布会的前提下直接发售了一款硬件产品——AI 智能体耳机 Ola Friend。这款产品沿用了开放式耳机的形态,单只重 6.6g,续航时间为 8 小时,搭配充电盒使用可达到 28 小时。充电 15 分钟可以播放音乐 2 小时,充满需要 2 小时。
Ola Friend 预售价 1199 元,与苹果旗下的 AirPods 系列蓝牙耳机相当。在官方宣传片中,用户佩戴 Ola Friend 耳机,喊出关键词「豆包豆包」,即可唤醒字节自研的聊天机器人「豆包」,开启语音交互。要调用耳机中的豆包,用户需要先将耳机和手机里的字节豆包 App 配对,才能使用耳机呼唤豆包。这意味着用户脱离了手机蓝牙允许的 10 米范围,耳机里的豆包也会掉线。
AI 硬件正在尝试寻找除手机之外的新交互入口,但目前的体验仍受限于连接稳定性与本地算力。
钱与人才流动分析
OpenAI 联创 Durk Kingma 加入 Anthropic
10 月 1 日,OpenAI 联合创始人 Durk Kingma 在社交媒体 X 发帖,宣布他将入职人工智能初创公司 Anthropic。2015 年,Kingma 加入 OpenAI 创始团队担任研究科学家,带领算法团队开发主要用于生成式 AI 模型的技术和方法。他曾于 2018 年 6 月从 OpenAI 离职,加入 DeepMind,领导了关于文本、图像和视频生成模型的多个项目。
核心人才的流动往往预示着技术路线或战略方向的调整,Anthropic 作为 OpenAI 的主要竞争对手之一,吸纳此类人才意在加强其安全对齐与模型研发实力。
Sora 负责人之一 Tim Brooks 加入 DeepMind
10 月 4 日,OpenAI 的文生视频大模型 Sora 团队负责人之一 Tim Brooks 在社交媒体 X 发帖称,自己已经离开 OpenAI,加入 Google DeepMind 团队。Google DeepMind 首席执行官 Demis Hassabis 发帖欢迎 Brooks,期待他「将世界模拟器的长期梦想变成现实」。
此前,Google 曾用「世界模拟器」一词形容其基础世界模型 Genie,此模型能根据单个图像提示,生成交互式、动作可控的环境。这显示出视频生成与物理世界模拟技术的融合趋势。
OpenAI 任命新的后训练主管,又有一名元老离职
10 月 10 日,有报道称 OpenAI 任命了 Liam Fedus 为后训练团队主管。后训练团队的任务是提高模型的稳健性、可靠性和安全性,确保 OpenAI 的产品在发布之前满足高标准。
上一任后训练主管 Barret Zoph 已于 9 月底和首席技术官 Mira Murati、首席研究官 Bob McGrew 同时离职。新上任的 Liam Fedus 曾在 Google Brain 工作,于 2022 年 9 月加入 OpenAI,参与过 ChatGPT 的研发,是 9 月 13 日发布的新推理模型 OpenAI o1 七大负责人之一。差不多同一时间,OpenAI 高级研究员 Luke Metz 在社交媒体宣布离职。他和 Barret Zoph、Liam Fedus 有着相似的职业背景,同样在 Google 担任过研究员,也是 ChatGPT 的幕后元老和 o1 的贡献者。
近日还有消息称,Barret Zoph 正在计划成立一家新公司,但尚不清楚 Luke Metz 和 Mira Murati 等人是否加入。
总结与展望
本周的行业动态揭示了大模型发展进入深水区后的阵痛。一方面,资本与巨头在基础设施和硬件层面的投入仍在加速,如特斯拉的电池技术与 AMD 的芯片竞争;另一方面,应用层厂商面临高昂的算力成本压力,部分独角兽选择放弃自研模型转向垂直场景。OpenAI 的人才动荡则反映了头部企业在追求 AGI 过程中的战略焦虑与组织挑战。
随着技术瓶颈的显现,行业重心正从单纯的模型规模竞赛转向效率优化、成本控制及特定场景的深度落地。未来的竞争将不仅取决于模型参数的大小,更取决于谁能更高效地将 AI 能力整合进实际生产力系统中。