大模型发展竞争愈发激烈。全球瞩目的文生视频 Sora、谷歌 Gemini 1.5、Meta 的 V-JEPA 以及超越 GPT-4 的 Claude 3 相继发布,OpenAI 的 GPT-5 也即将问世。奥特曼不仅自研芯片,还投资可控核聚变公司,以算力和能源为未来储备关键资源。在算力紧平衡和数据资源荒的背景下,面对快速变革,笔者尝试对未来大模型的发展做出十个预判。
趋势一:中国基础大模型的数量会快速收敛,卷不动了
中国大模型行业曾呈现'百模大战'态势,但 2024 年随着基础大模型如 Claude 3 和视频大模型如 Sora 的能力显著提升,资源不足和'套壳'大模型厂商可能被迫退出市场。行业将转向几家大厂和少量明星创业企业的竞争格局。国外则以大厂与创业公司合作为主,如微软与 OpenAI、谷歌与 DeepMind 等。芯片巨头英伟达也在 2023 年大举投资生成式 AI 项目,比 2022 年多 6 倍。但国外基础大模型领域并未出现类似的过度激烈竞争,这提示我们单纯堆砌数量已无意义,质量与生态整合才是关键。
趋势二:万卡集群是入门的算力门槛
近日,Perplexity 的 CEO Srinivas 在《Invest Like The Best》节目中透露,他曾试图从 Meta 聘请资深研究员,但被对方以需要 1 万块 H100 GPU 回应,反映了基础大模型训练对算力的巨大需求。GPT-4 和 GPT-5 的训练分别需要 2.5 万张 A100 和 5 万张 H100(相当于 15 万张 A100)的算力。扎克伯格计划购买 35 万张 H100 芯片以追赶 GPT-5。而 OpenAI 创始人奥特曼计划筹集 7 万亿美元自研 AI 芯片。在中国,2023 年前三季度,英伟达中国营收推算显示,中国新购买的算力相当于 58 万张 A100,但仍远不及 Meta。受美国芯片禁令影响,中国无法补充先进算力,导致处于严重被动。国内芯片厂商如华为、海光等,受制于产能问题,供货量距离大模型训练需求尚有较大缺口。此外,国产 AI 芯片存在适配周期长、成本高、难度大等问题,延长了国产大模型训练周期。这意味着未来只有拥有稳定算力供应链的企业才能生存。
趋势三:大模型的能力取决于团队顶尖人才的认知密度
大模型的发展由顶尖人才推动,人才密度和强度是关键。OpenAI 的三位灵魂人物——Sam Altman、Greg Brockman 和首席科学家伊利亚,在 7 年间持续投入数十亿美元,坚持 AGI 信仰,成就了 ChatGPT 的传奇。同样备受瞩目的 Claude 模型公司,由 OpenAI 核心员工如 Dario Amodei 和 Tom Brown 创立,其成员对大模型的深刻理解是取得突破的原因。尽管只有 22 人,但 Character.ai 因其 Google 前员工 Noam Shazeer 的技术背景,成为访问量第二的聊天应用。而 20 多人的 Mistral 公司,由前 DeepMind 和 Meta 科学家创办,三位创始人均有大模型开发经验,并在基准测试中表现出色。这表明小团队若能汇聚高认知密度人才,依然能在大模型领域实现弯道超车。
趋势四:开源大模型难以胜过闭源
开源是软件领域的重要趋势,推动了应用生态的繁荣。然而,从 GPT-3 开始,OpenAI 选择了闭源,导致开源大模型停滞在 GPT-3.5 水平。目前,业界口碑较好的开源大模型包括 Meta 的 LLaMA2、Mistral 的 Mistral 8x7B、智谱的 ChatGLM-6B 等。大模型的代际碾压效应导致基于旧版开源的小公司面临倒闭风险。开源方式更适合做生态,但受限于算力和算法等,原有集众智的开源模式很难在基础大模型自身的快速演进上复现。闭源模型通过私有数据迭代和专用硬件优化,往往能保持性能领先优势。
趋势五:能走多远,取决于对 AGI 和 Scaling Law 的信仰
OpenAI 等大模型企业对 AGI 的信仰获得更多认同,Sora 从视频理解到世界模拟器的路径、杨乐昆的世界模型构想,都是产业界迈向 AGI 的努力。大力出奇迹的范式被证明有效,包括 Sora 的成功,也再次验证了视频领域 Scaling Law 的有效性。OpenAI 以 Scaling Law 为核心理念,坚信规模化在模型、系统、自身、过程和雄心壮志中的魔力,鼓励在疑惑时扩大规模。这种对规模的执着是技术突破的核心动力,但也带来了巨大的能耗和成本挑战。
趋势六:个人应用要过千万月活门槛
移动互联网时代的 APP 用户数量庞大,但中国 AI 原生 APP 增长相对较慢,目前头部的 APP 月活用户刚刚突破千万。即使在互联网圈,也有很多人没有使用过这些 APP,特别是在三四线或更小的城市。根据 QuestMobile 报告,头部 APP 应用去重月活用户突破 5000 万,这些应用主要集中在文本和图像生成领域。其中,豆包、文心一言等应用以月千万活跃用户规模领先,其次是天工、扮伴-AI 绘画及讯飞星火等应用。相比而言,2022 年 9 月至 2023 年 8 月期间,全球排名前 50 的人工智能工具吸引了超过 240 亿次访问。ChatGPT 以 140 亿次访问量领先,占分析流量的 60% 以上。这说明网络效应在 AI 应用中依然显著,头部效应明显。
趋势七:手机端侧大模型将加剧和超级 APP 的入口之争
大模型正逐渐转向端侧,使得 AI 推理能够在手机、PC、耳机、音箱、XR、汽车等新型终端上运行。端侧大模型具有优势,如本地数据处理效率高、节省云端成本、增强用户数据隐私保护,以及开启新的交互方式。未来,结合向量化后的个人数据,端侧大模型将提升手机交互流畅性,实现更多原生操作和功能。多家企业已推出端侧大模型,如小米的 MiLM、VIVO 的蓝心等。此外,高通和苹果等芯片厂商也在积极支持端侧推理。然而,端侧大模型可能成为新的手机交互入口,可能导致 APP 被边缘化,加剧手机企业在生态内的话语权。这将重塑移动互联的流量分发逻辑。


