国产大模型淘汰赛在加速
这轮淘汰赛预计会持续一两年,只有少数真正具备实力的基础模型企业能继续活下去。
中国市场的大模型价格战现状
中国市场的大模型价格战已经打了近半年。这轮价格战已经打到了负毛利,而且暂时没有停止迹象。头部云厂商仍在酝酿新一轮降价。这轮降价会在今年 9 月下旬落地。
今年 5 月,中国云厂商开始大模型推理算力价格战。字节跳动旗下云服务火山引擎、阿里云、百度智能云、腾讯云先后把大模型推理算力价格下降了 90% 以上。
使用大模型要输入提示语言,经过推理得到内容输出。这个过程会调用 API(应用程序编程接口),按消耗 Token(Token 是大模型的文本单位)数量付费。这就像为水电按使用量缴费。
降价后,推理算力消耗量确在快速增长。今年 8 月,百度二季度财报电话会披露,百度文心大模型 5 月 API 日均调用次数是 2 亿,8 月增长到了 6 亿次;5 月日均 Token 消耗量是 2500 亿,8 月增长到了 1 万亿。字节跳动今年 8 月宣布,截至 7 月字节跳动豆包大模型日均 Token 用量超过 5000 亿。相比 5 月,平均每家企业日均 Token 使用量增长了 22 倍。
Token 价格下降了 90% 以上。这在短期内会降低云厂商的推理收入。但云厂商期望通过这种方式降低企业客户试错门槛,形成 10 倍以上的指数级算力消耗,最终获得长期收入增长。
国内大模型市场的推理算力价格战持续半年,目前有三个基本事实:
其一,推理算力价格战,已经打到了负毛利。近期,包括阿里云、百度智能云在内的多位云厂商负责人透露,今年 5 月以前,国内大模型推理算力毛利率高于 60%,和国际同行基本一致。今年 5 月各大厂接连降价后,推理算力毛利率跌至负数。
其二,国内模型和 OpenAI 的同规格模型相比,价格普遍只有其 20%-50%。国内大模型毛利率远低于 OpenAI。国际市场调研机构 FutureSearch 今年 8 月的研究报告称,OpenAI 旗下 GPT-4 系列旗舰模型毛利率约为 75%,GPT-4o 系列主力模型毛利率约为 55%。OpenAI 综合毛利率至少超过 40%。
其三,模型能力不足是价格战的重要成因。一位云厂商大模型业务核心负责人认为,目前国内的旗舰模型能力普遍和 OpenAI 的 GPT-4 系列旗舰模型存在差距,所以要通过降价鼓励客户试错。随着模型价格持续下降,价格已不再是企业客户最关注的因素。模型的能力、效果,才是企业客户最关心的。
不得不打的价格战
我们查阅了阿里云、火山引擎、百度智能云、腾讯云以及 OpenAI 官网公布的大模型推理价格。国内模型和 OpenAI 的同规格模型相比,价格普遍只有 20%-50%。
以阿里的通义千问-Max、百度的 ERNIE-4.0-8K、腾讯的 hunyuan-pro 三款旗舰模型为例,三者每百万 Tokens 的输出价格分别是 120 元、120 元、100 元。它们对标的 OpenAI 旗舰模型 GPT-4-turbo 每百万 Tokens 输出价格是 210 元(OpenAI 官网标价是 30 美元,此处已按美元和人民币汇率 1:7 换算)。这三款国产大模型的价格仅为 GPT-4-turbo 的 50% 左右。
以阿里的 Qwen-Long、百度的 ERNIE-Speed-Pro-128K、腾讯的 hunyuan-embedding 三款入门模型为例,三者每百万 Tokens 的输出价格分别是 2 元、0.8 元、5 元。OpenAI 的廉价模型 gpt-4o-mini 百万 Tokens 输出价格是 4.2 元(OpenAI 官网标价是 0.6 美元,此处已按美元和人民币汇率 1:7 换算)。阿里和百度的入门模型仅为 OpenAI 入门模型价格的 48% 和 19%。
大模型价格战已经打到了负毛利,但这并未止住各个云厂商继续降价的步伐。
我们得到的消息是,阿里云等头部云厂商仍在酝酿新一轮降价。这轮降价会在今年 9 月下旬落地。高性能的旗舰模型是这轮降价重点。
上述云厂商大模型业务核心负责人认为,廉价小尺寸模型目前降价空间不大,上轮降价已降到了企业客户的'心理底线'。下一步的关注重点是,各家旗舰模型是否会继续降价。旗舰模型也会进一步细分,分化出能解决大部分问题的高性价比版本,以及解决超难问题的高质量、高价格版本。
为何还要持续降价?
大型云厂看长期市场大势——云计算的算力结构正在剧变。抢占更多推理算力,就是抢占更多增量市场。国际市场调研机构 IDC 预测,2022 年 -2027 年中国通用算力年复合增速 16.6%,智能算力年复合增速 33.9%。2022 年 -2027 年,智能算力内部,推理算力占比将上升到 72.6%,训练算力占比会下滑到 27.4%。
云厂商愿意为了预期中的长期增长放弃短期收入。在短期内,推理算力能带来的收入并不多。一位中国云厂商技术人士解释,2024 年各家模型调用收入不会超过 10 亿元,这在每年数百亿营收的大盘中规模有限。云厂商愿意在未来 1 年 -2 年接受短期收入损失和业务亏损。大家赌的是,未来 1 年 -2 年大模型调用次数至少有 10 倍以上的指数级增长。最终,长期收入增长能弥补短期收入损失。
他进一步解释,这个过程中,算力成本会随着客户需求增长逐渐摊薄。大模型业务最终仍有机会实现正向利润。即使赌局不成立,也会有一批模型厂商死于价格战,活下去的厂商会收拾残局。
不同云厂商面对价格战,也有不同的竞争考量——火山引擎、阿里云、百度智能云都在参与一场必须要打的价格战。
火山引擎目前在中国公共云市场份额未进入前五,但 2023 年火山引擎营收增速超过 150%。大模型是它在云市场弯道追赶的重要机会。火山引擎总裁谭待今年 5 月提到,今年 3 月他在硅谷发现,美国 AI 应用创业呈现了 2012 年 -2014 年中国移动互联网初期的趋势。'AI 应用创业小团队,很快取得营收和融资。中国市场未来可能会呈现这种趋势。但前提是,推理价格要降低,试错门槛要降低。'


