AI 大模型发展的十大关键趋势研判
当前,人工智能大模型领域的竞争已进入白热化阶段。从全球瞩目的文生视频模型 Sora、谷歌 Gemini 1.5、Meta 的 V-JEPA 到超越 GPT-4 的 Claude 3,技术迭代速度惊人。OpenAI 的 GPT-5 也即将问世。与此同时,行业领袖如奥特曼不仅自研芯片,还投资可控核聚变公司,以算力和能源为未来储备关键资源。在算力紧平衡和数据资源荒的背景下,面对快速变革,本文尝试对未来大模型的发展做出十个深度预判。
文章分析了 AI 大模型发展的十大趋势,涵盖行业收敛、算力门槛、人才密度、开源闭源对比、AGI 信仰、用户规模、端侧模型、核心价值、一人企业及技术变现路线之争。内容指出中国大模型将走向集中化,万卡算力成入门标准,顶尖人才决定模型上限,开源难敌闭源,Scaling Law 仍是核心驱动力。同时强调端侧模型将重塑交互入口,效率与创造是落地关键,一人企业兴起,技术信仰与商业变现将在三年内分出胜负。最终结论是大模型发展受限于算力和电力资源。

当前,人工智能大模型领域的竞争已进入白热化阶段。从全球瞩目的文生视频模型 Sora、谷歌 Gemini 1.5、Meta 的 V-JEPA 到超越 GPT-4 的 Claude 3,技术迭代速度惊人。OpenAI 的 GPT-5 也即将问世。与此同时,行业领袖如奥特曼不仅自研芯片,还投资可控核聚变公司,以算力和能源为未来储备关键资源。在算力紧平衡和数据资源荒的背景下,面对快速变革,本文尝试对未来大模型的发展做出十个深度预判。
中国大模型行业曾呈现'百模大战'态势,但 2024 年随着基础大模型如 Claude 3 和视频大模型如 Sora 的能力大幅提升,资源不足和'套壳'大模型厂商可能面临退出风险。行业将转向几家大厂和少量明星创业企业的竞争格局。国外则以大厂与创业公司合作为主,如微软与 OpenAI、谷歌与 DeepMind 等。芯片巨头英伟达也在 2023 年大举投资生成式 AI 项目,比 2022 年多 6 倍。但国外基础大模型领域并未出现类似的激烈同质化竞争,这主要得益于其更完善的生态协同和资本耐心。
在中国市场,由于数据合规要求提高以及训练成本激增,缺乏核心算法能力和数据壁垒的小厂难以生存。未来,只有拥有高质量私有数据、强大工程化能力或特定场景落地能力的企业才能存活。行业将从'拼数量'转向'拼质量'和'拼应用'。
近日,Perplexity 的 CEO Srinivas 在《Invest Like The Best》节目中透露,他曾试图从 Meta 聘请资深研究员,但被对方以需要 1 万块 H100 GPU 回应,反映了基础大模型训练对算力的巨大需求。GPT-4 和 GPT-5 的训练分别需要 2.5 万张 A100 和 5 万张 H100(相当于 15 万张 A100)的算力。扎克伯格计划购买 35 万张 H100 芯片以追赶 GPT-5。而 OpenAI 创始人奥特曼计划筹集 7 万亿美元自研 AI 芯片,显示出算力已成为战略级资源。
在中国,2023 年前三季度,英伟达中国营收推算显示,中国新购买的算力相当于 58 万张 A100,但仍远不及 Meta 等海外巨头。受美国芯片禁令影响,中国无法补充先进算力,导致处于严重被动。国内芯片厂商如华为、海光等,受制于产能问题,供货量距离大模型训练需求尚有较大缺口。此外,国产 AI 芯片存在适配周期长、成本高、难度大等问题,延长了国产大模型训练周期。未来,异构计算和软件栈优化将成为弥补硬件短板的关键。
大模型的发展由顶尖人才推动,人才密度和强度是关键。OpenAI 的三位灵魂人物——Sam Altman、Greg Brockman 和首席科学家伊利亚,在 7 年间持续投入数十亿美元,坚持 AGI 信仰,成就了 ChatGPT 的传奇。同样备受瞩目的 Claude 模型公司,由 OpenAI 核心员工如 Dario Amodei 和 Tom Brown 创立,其成员对大模型的深刻理解是取得突破的原因。尽管只有 22 人,但 Character.ai 因其 Google 前员工 Noam Shazeer 的技术背景,成为访问量第二的聊天应用。而 20 多人的 Mistral 公司,由前 DeepMind 和 Meta 科学家创办,三位创始人均有大模型开发经验,并在基准测试中表现出色。
这表明,在大模型时代,精英团队的认知高度决定了产品的上限。小团队若能聚焦核心算法创新或垂直领域数据,依然有机会实现弯道超车。反之,单纯堆砌人力而无核心技术积累的团队将被淘汰。
开源是软件领域的重要趋势,推动了应用生态的繁荣。然而,从 GPT-3 开始,OpenAI 选择了闭源,导致开源大模型停滞在 GPT-3.5 水平。目前,业界口碑较好的开源大模型包括 Meta 的 LLaMA 2、Mistral 的 Mistral 8x7B、智谱的 ChatGLM-6B 等。大模型的代际碾压效应导致基于旧版本开源模型的小公司面临倒闭风险。
开源方式更适合做生态,但受限于算力和算法等,原有集众智的开源模式很难在基础大模型自身的快速演进上复现。闭源模型通过控制权重分发,能更好地保护商业机密和安全策略。未来,开源与闭源将形成互补:闭源用于追求极致性能和安全性,开源用于构建插件生态和降低使用门槛。
OpenAI 等大模型企业对 AGI 的信仰获得更多认同,Sora 从视频理解到世界模拟器的路径、杨立昆的世界模型构想,都是产业界迈向 AGI 的努力。大力出奇迹的范式被证明有效,包括 Sora 的成功,也再次验证了视频领域 Scaling Law 的有效性。OpenAI 以 Scaling Law 为核心理念,坚信规模化在模型、系统、自身、过程和雄心壮志中的魔力,鼓励在疑惑时扩大规模。
Scaling Law(扩展定律)指出,模型性能随参数量、数据集大小和计算量的增加而提升。虽然边际效应递减,但在足够大的规模下,涌现能力(Emergent Abilities)将产生质的飞跃。这一理论支撑了未来几年大模型规模的持续扩张,但也带来了能耗和成本的挑战。
移动互联网时代的 APP 用户数量庞大,但中国 AI 原生 APP 增长相对较慢,目前头部的 APP 月活用户刚刚突破千万。即使在互联网圈,也有很多人没有使用过这些 APP,特别是在三四线或更小的城市。根据 QuestMobile 报告,头部 APP 应用去重月活用户突破 5000 万,这些应用主要集中在文本和图像生成领域。其中,豆包、文心一言等应用以月千万活跃用户规模领先,其次是天工、扮伴-AI 绘画及讯飞星火等应用。
相比而言,2022 年 9 月至 2023 年 8 月期间,全球排名前 50 的人工智能工具吸引了超过 240 亿次访问。ChatGPT 以 140 亿次访问量领先,占分析流量的 60% 以上。这说明用户习惯的培养需要时间,且网络效应显著。只有跨过千万月活门槛,应用才能形成足够的反馈闭环来优化模型,进而实现商业化闭环。
大模型正逐渐转向端侧,使得 AI 推理能够在手机、PC、耳机、音箱、XR、汽车等新型终端上运行。端侧大模型具有优势,如本地数据处理效率高、节省云端成本、增强用户数据隐私保护,以及开启新的交互方式。未来,结合向量化后的个人数据,端侧大模型将提升手机交互流畅性,实现更多原生操作和功能。多家企业已推出端侧大模型,如小米的 MiLM、VIVO 的蓝心等。此外,高通和苹果等芯片厂商也在积极支持端侧推理。
然而,端侧大模型可能成为新的手机交互入口,可能导致 APP 被边缘化,加剧手机企业在生态内的话语权。端侧部署涉及模型压缩、量化加速等技术挑战,INT8/FP4 量化方案正在逐步成熟。这将重塑人机交互的底层逻辑,从'搜索 - 点击'转向'意图 - 执行'。
效率是大模型推动自动化的核心逻辑。体验和创造则是其落地的特别驱动力。交互更加友好,机器逐渐适应人,理解指令、语言甚至情感。创造是生成式大模型的核心能力,已被广泛应用于文字、图片创作、传媒影视、广告、短视频和游戏等领域。模型幻觉问题也可能通过创造的方式激发更多灵感。在 AI4S 领域,创造提供了更大的想象空间,AI 科学家有望在未来取得更多突破。例如,DeepMind 开发的深度学习工具在 17 天内合成了 41 个拟定化合物,成功率达 71%,每天平均产出 2 个以上新化合物。
企业落地大模型需明确价值锚点:是降本增效,还是创造新业务?RAG(检索增强生成)技术能有效缓解幻觉,提升专业领域回答的准确性。Agent(智能体)框架则让模型具备规划、工具和记忆能力,实现复杂任务自动化。
大模型与 AI Agent 的进步,为个人提供了更多智能工具支持。未来,个人可能拥有多个助理,从而加大了对个人领导力和判断力的要求。一人企业的趋势也在改变大企业的组织方式,组织内个人的角色变得更为多元,如身兼数职。同时,数字员工成为企业核心竞争力之一,其数量和质量至关重要。
低代码平台与大模型结合,使得非技术人员也能构建应用。个人开发者可以利用 API 快速集成大模型能力,专注于业务逻辑而非基础设施。这将极大降低创业门槛,催生大量微型创新和独立开发者经济。
最近,'小珺访谈录'的两篇文章对杨植麟和朱啸虎的观点进行了比较,表明中国科技界对大模型的态度存在分歧。一方是技术信仰派,主张像 OpenAI 一样追求 AGI 和 scaling law,认为模型能力提升和成本降低将解锁更多应用。另一方是市场信仰派,认为应将足够的 AI 能力投入能快速变现的商业场景中,利用中国市场的独特数据建立优势。这种分歧反映了长期主义和实用主义的争论。
OpenAI 的成功为长期主义提供了激励,预计到 2026 年将迎来 GPT-6 等更强模型,具有商业价值。然而,降低幻觉率仍是技术挑战,未来大模型可能提供置信度概率,以区分参考和确定性判断。最终,技术突破必须服务于商业价值,否则难以持续。两者并非对立,而是不同发展阶段的重心选择。
综上,基于 scaling law,未来模型的规模无可想象,大模型之路的尽头是算力,更是电力。能源限制将成为制约 AI 发展的物理瓶颈,绿色计算和高效架构将是未来的研究重点。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online