
从 2024 年开始,采购和租用算力设备的企业数量明显减少;2024 年下半年以来,算力中心的机架出现了一定程度的空置。曾被炒到 15 万元一块的英伟达高性能加速卡 A100 的价格不再上涨,另一款性能配置相对较低的 4090 显卡被算力企业频繁采购用作算力加速芯片。

人工智能产业的阶段性转变
2024 年至今,人工智能产业发生了显著的阶段性转变。根据经济观察报统计,截至 2024 年 10 月 9 日,网信办共通过 188 项生成式人工智能备案,这意味着有 188 个大模型可以上线提供生成式人工智能服务。然而,超过三成的大模型在通过备案后未进一步公开其进展情况;仅有约一成的大模型仍在加速训练模型;接近一半的大模型则转向了 AI 应用的开发。
这与过去一年多来的'百模大战'形成鲜明对比。这一变化也传导至上游的算力市场。2024 年 9 月 27 日—29 日中国算力大会召开期间,从算力运营方、建设方和芯片供应商处获悉,国内算力的供需关系已不再紧张。
2022 年以来,互联网公司、人工智能企业争相采购算力设备,以运营商为代表的央国企投入巨资建设算力中心。供应链上的 AI 服务器经常缺货,算力 GPU 一卡难求,数月内价格翻倍。但从 2024 年开始,采购和租用算力设备的企业减少了,算力中心的机架出现了一定程度的空置。
一位中国电信人士称,算力已经转入买方市场。

大模型企业分化
算力的使用者——大模型企业正出现明显的分化现象。
截至 2024 年 8 月底,网信办共通过 188 项生成式人工智能备案。根据统计,有 60 个(32%)大模型在备案通过后,没有再公布过提升大模型参数量级或应用落地的进展,有 9 个(5%)大模型更新了版本,但未说明参数量级及预训练数据量变化。这些模型绝大多数来自中小型企业或机构,例如深言科技、聆心智能等企业的多个开源社区项目近一年没有更新。
这 188 个大模型中,仍有 22 个模型在加速训练,在今年更新了版本并增加参数量及预训练数据量。这些模型主要来自大型互联网公司、运营商、AI 大模型企业,其中只有 4 家企业发布万亿级参数的大模型,且大规模增加了预训练的数据量,包括腾讯、中国电信以及两家大模型创业公司 MiniMax 和阶跃星辰。
这些企业对用于训练大模型的算力明显增加了需求。2024 年以来,腾讯、中国电信已经建成万卡集群算力池,MiniMax 则是在 3 月首批入驻中国电信上海临港国产万卡算力池。
另外 18 个模型的参数量在百亿至千亿级别,参数量和预训练数据量的增加较为有限,这些模型来自百度、阿里巴巴、科大讯飞、商汤科技、华为等企业。
这些厂商也在加速更新基础模型。阿里巴巴发布了通义千问 2.5 版本,参数量达到千亿级别,这是继去年 10 月 2.0 版本后的一次重大更新。2024 年上半年,商汤科技将'日日新'大模型推进至 6000 亿参数规模。相比之下,去年更新较快的百度步伐有所放缓,其文心 4.0 大模型自去年 10 月以来未有新版本发布。
一位百度技术人士告诉媒体,百度的基础模型一直在进行最前沿的 AI 训练,只是目前还没公布成果,'大厂肯定不会放弃训练模型的,否则就彻底分不到蛋糕了'。
表 1:188 个已备案大模型在 2024 年(截至 10 月 9 日)的变化情况
| 模型状态 | 数量 | 占比 |
|---|---|---|
| 无后续进展 | 60 | 32% |



