国产大模型价格战进入负毛利阶段，行业竞争格局分析

中国大模型市场经历近半年价格战，推理算力毛利率跌至负数。头部云厂商通过降价换取长期市场份额与指数级调用增长，但面临模型能力不足与高昂算力成本挑战。相比 OpenAI 的高毛利健康模式，国内厂商需探索差异化路径。淘汰赛加速，预计仅少数基础模型企业能存活，创业公司转向垂直领域或应用层。企业应关注模型实际效果与 ROI，技术侧采用模型压缩、蒸馏及垂直微调策略，生态侧加强合作，共同推动产业健康发展。

NodeJser发布于 2025/2/7更新于 2026/6/1429 浏览

国产大模型淘汰赛在加速

这轮淘汰赛预计会持续一两年，只有少数真正具备实力的基础模型企业能继续活下去。

中国市场的大模型价格战现状

中国市场的大模型价格战已经打了近半年。这轮价格战已经打到了负毛利，而且暂时没有停止迹象。头部云厂商仍在酝酿新一轮降价。这轮降价会在今年 9 月下旬落地。

今年 5 月，中国云厂商开始大模型推理算力价格战。字节跳动旗下云服务火山引擎、阿里云、百度智能云、腾讯云先后把大模型推理算力价格下降了 90% 以上。

使用大模型要输入提示语言，经过推理得到内容输出。这个过程会调用 API（应用程序编程接口），按消耗 Token（Token 是大模型的文本单位）数量付费。这就像为水电按使用量缴费。

降价后，推理算力消耗量确在快速增长。今年 8 月，百度二季度财报电话会披露，百度文心大模型 5 月 API 日均调用次数是 2 亿，8 月增长到了 6 亿次；5 月日均 Token 消耗量是 2500 亿，8 月增长到了 1 万亿。字节跳动今年 8 月宣布，截至 7 月字节跳动豆包大模型日均 Token 用量超过 5000 亿。相比 5 月，平均每家企业日均 Token 使用量增长了 22 倍。

Token 价格下降了 90% 以上。这在短期内会降低云厂商的推理收入。但云厂商期望通过这种方式降低企业客户试错门槛，形成 10 倍以上的指数级算力消耗，最终获得长期收入增长。

国内大模型市场的推理算力价格战持续半年，目前有三个基本事实：

其一，推理算力价格战，已经打到了负毛利。近期，包括阿里云、百度智能云在内的多位云厂商负责人透露，今年 5 月以前，国内大模型推理算力毛利率高于 60%，和国际同行基本一致。今年 5 月各大厂接连降价后，推理算力毛利率跌至负数。

其二，国内模型和 OpenAI 的同规格模型相比，价格普遍只有其 20%-50%。国内大模型毛利率远低于 OpenAI。国际市场调研机构 FutureSearch 今年 8 月的研究报告称，OpenAI 旗下 GPT-4 系列旗舰模型毛利率约为 75%，GPT-4o 系列主力模型毛利率约为 55%。OpenAI 综合毛利率至少超过 40%。

其三，模型能力不足是价格战的重要成因。一位云厂商大模型业务核心负责人认为，目前国内的旗舰模型能力普遍和 OpenAI 的 GPT-4 系列旗舰模型存在差距，所以要通过降价鼓励客户试错。随着模型价格持续下降，价格已不再是企业客户最关注的因素。模型的能力、效果，才是企业客户最关心的。

不得不打的价格战

我们查阅了阿里云、火山引擎、百度智能云、腾讯云以及 OpenAI 官网公布的大模型推理价格。国内模型和 OpenAI 的同规格模型相比，价格普遍只有 20%-50%。

以阿里的通义千问-Max、百度的 ERNIE-4.0-8K、腾讯的 hunyuan-pro 三款旗舰模型为例，三者每百万 Tokens 的输出价格分别是 120 元、120 元、100 元。它们对标的 OpenAI 旗舰模型 GPT-4-turbo 每百万 Tokens 输出价格是 210 元（OpenAI 官网标价是 30 美元，此处已按美元和人民币汇率 1:7 换算）。这三款国产大模型的价格仅为 GPT-4-turbo 的 50% 左右。

以阿里的 Qwen-Long、百度的 ERNIE-Speed-Pro-128K、腾讯的 hunyuan-embedding 三款入门模型为例，三者每百万 Tokens 的输出价格分别是 2 元、0.8 元、5 元。OpenAI 的廉价模型 gpt-4o-mini 百万 Tokens 输出价格是 4.2 元（OpenAI 官网标价是 0.6 美元，此处已按美元和人民币汇率 1:7 换算）。阿里和百度的入门模型仅为 OpenAI 入门模型价格的 48% 和 19%。

大模型价格战已经打到了负毛利，但这并未止住各个云厂商继续降价的步伐。

我们得到的消息是，阿里云等头部云厂商仍在酝酿新一轮降价。这轮降价会在今年 9 月下旬落地。高性能的旗舰模型是这轮降价重点。

上述云厂商大模型业务核心负责人认为，廉价小尺寸模型目前降价空间不大，上轮降价已降到了企业客户的'心理底线'。下一步的关注重点是，各家旗舰模型是否会继续降价。旗舰模型也会进一步细分，分化出能解决大部分问题的高性价比版本，以及解决超难问题的高质量、高价格版本。

为何还要持续降价？

大型云厂看长期市场大势——云计算的算力结构正在剧变。抢占更多推理算力，就是抢占更多增量市场。国际市场调研机构 IDC 预测，2022 年 -2027 年中国通用算力年复合增速 16.6%，智能算力年复合增速 33.9%。2022 年 -2027 年，智能算力内部，推理算力占比将上升到 72.6%，训练算力占比会下滑到 27.4%。

云厂商愿意为了预期中的长期增长放弃短期收入。在短期内，推理算力能带来的收入并不多。一位中国云厂商技术人士解释，2024 年各家模型调用收入不会超过 10 亿元，这在每年数百亿营收的大盘中规模有限。云厂商愿意在未来 1 年 -2 年接受短期收入损失和业务亏损。大家赌的是，未来 1 年 -2 年大模型调用次数至少有 10 倍以上的指数级增长。最终，长期收入增长能弥补短期收入损失。

他进一步解释，这个过程中，算力成本会随着客户需求增长逐渐摊薄。大模型业务最终仍有机会实现正向利润。即使赌局不成立，也会有一批模型厂商死于价格战，活下去的厂商会收拾残局。

不同云厂商面对价格战，也有不同的竞争考量——火山引擎、阿里云、百度智能云都在参与一场必须要打的价格战。

火山引擎目前在中国公共云市场份额未进入前五，但 2023 年火山引擎营收增速超过 150%。大模型是它在云市场弯道追赶的重要机会。火山引擎总裁谭待今年 5 月提到，今年 3 月他在硅谷发现，美国 AI 应用创业呈现了 2012 年 -2014 年中国移动互联网初期的趋势。'AI 应用创业小团队，很快取得营收和融资。中国市场未来可能会呈现这种趋势。但前提是，推理价格要降低，试错门槛要降低。'

国产大模型价格战进入负毛利阶段，行业竞争格局分析

国产大模型淘汰赛在加速

中国市场的大模型价格战现状

不得不打的价格战

为何还要持续降价？

更多推荐文章

相关免费在线工具

价格不是决定因素

淘汰赛加速

企业应对与技术演进建议

更多推荐文章

相关免费在线工具

国产大模型价格战进入负毛利阶段，行业竞争格局分析

国产大模型淘汰赛在加速

中国市场的大模型价格战现状

不得不打的价格战

为何还要持续降价？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

价格不是决定因素

淘汰赛加速

企业应对与技术演进建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具