跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

大厂为何对大模型投入变得谨慎?

综述由AI生成文章分析了当前大模型赛道面临的商业化困境与高昂成本。摩根士丹利与高盛报告指出 AI 变现不及预期,OpenAI 等巨头虽融资巨大但仍亏损。国内大厂如百度、阿里、腾讯在财报中显示投入趋于谨慎,从盲目追求基础模型转向应用落地与场景赋能。技术路线上,OpenAI o1 引入自博弈强化学习打破传统 Scaling Law 共识,国产模型面临追赶压力。结论认为单纯烧钱难以为继,未来竞争关键在于垂直行业应用的深度结合与成本控制,需平衡算力成本、场景深耕与开源生态建设。

BackendPro发布于 2025/2/7更新于 2026/6/221 浏览
大厂为何对大模型投入变得谨慎?

身处于观望期的大模型赛道,似乎任何风吹草动,都让市场有了不同以往的波动。

近日,摩根士丹利发布报告称,中国 AI 正在面临更大的变现问题,文中直接指出 AI 应用先行者业绩不及预期,金山办公和万兴科技在推出 AI 产品后收入增长令人失望。

随后,多家媒体传言,由于资金投入巨大,以及商业化不及预期,百度可能放弃通用大模型研发。此消息一出,引发市场剧烈波动,百度文心一言市场部负责人迅速出面否认。该负责人称'文心一言刚完成了功能全面升级,我们将持续加大在通用大模型领域的研发投入。'

但只要简单算账,其实当下大模型赛道的尴尬,似乎是一张明牌。

6 月末,高盛的一篇名为《投资太多,收益太少》,将 AI 泡沫论推到台前。文章直言,大公司计划在未来几年投入 1 万亿美元在 AI 相关的东西上,比如数据中心、芯片和电网。但到现在为止,这些钱除了让开发人员的工作效率提高了一点,没看到其他明显的成果。

红杉资本的结论似乎更为直接,在其分析师大卫卡恩的报告中认为 AI 产业泡沫正在加剧,年产值超过 6000 亿美元,才够支付数据中心、加速 GPU 卡等 AI 基础设施费用。而之前的分析中,大卫假设即每年,谷歌、微软、苹果和 Meta 能从新产生的 AI 相关收入中获利 100 亿美元。同时,甲骨文、字节跳动、阿里、腾讯、X 和特斯拉每家能产生 50 亿美元的全新 AI 收入。即便如此,关于 AI 盈利的需要的缺口,仍然在不断扩大。

而回归到国内,在经历了年初的大降价之后,大厂对于大模型的态度,似乎也开始变得暧昧,诸多大厂在财报电话会中,声称会对人工智能加大投资力度,但实际来看,投入却开始变得谨慎。最明显的征兆就是,大厂的负责人开始弱化基础大模型迭代,强调应用的落地。'没有应用,开源闭源模型都一文不值。'其实,反应到当下,应用落地较为成熟如文生图,文生视频等,成了整齐划一的方向。

但需要清醒认识到的是,由于客观条件的限制,最简单的货币化手段,如 OpenAI 对 GPT 收费每月 20-25 美元的方式,在国内几乎无法复制,基于 API 调度的商业模式也被内卷到利润空间稀薄,而各大厂期待的 AI 应用,落地时间以及效率也远不及预期。面对未来越来越大的投入,以及遥遥无期的回报,大厂的焦虑似乎不断上升。

而另一方面,AGI 的路径越往前走,共识也开始被打破,OpenAI 全新的 O1 模型,采用的 Self-play RL(自博弈强化学习),与之前传统以 scaling law 为主的训练方式又有全新的变化。而对于国产大模型,GPT4 还未完全赶超,新的范式又出现。

前后夹击之下,形成了流言的土壤,也意味着国产大模型到了关键的时刻,到底是孤注一掷的投入,还是观望等待技术陡峭走平后,发挥后发优势,似乎决定着未来竞争格局的走势,大厂依然能够依托大模型,赋能场景,将自家的门看好,但如若想要更进一步,一连串的问题,都急需一个明确的答案。

越来越昂贵的'游戏'

从各个角度来看,AI 都在成为一场富人的游戏。

根据第一财经的报道,在最近的季度财报电话会议上,谷歌、微软和 Meta 都强调了在 AI 上的巨大投资。Meta 将今年的支出预测提高了至多 100 亿美元,谷歌计划每季度资本支出约 120 亿美元。微软最近一个季度花费了 140 亿美元,预计这一支出将'显著'增加。以数据中心为例,根据美国市场研究机构 Synergy 研究集团预计,未来每年将有 120-130 个超大规模数据中心上线。而每座数据中心的造价都以亿美元为单位。

与此同时,据彭博报道,OpenAI 正以 1500 亿美元估值,洽谈 65 亿美元融资,并计划通过循环信贷筹措 50 亿美元债务融资。

本轮融资将由 Thrive Capital 领投,OpenAI 最大的投资者微软将参与其中,苹果、英伟达等巨头也一直在就投资进行谈判。

而 AI 以及大模型赛道的昂贵,不仅在于越来越快的烧钱速度,还在于,短期难以回本的现实。据报道显示,2024 年年初,OpenAI 的年收入已超过 34 亿美元,但因为 AI 太烧钱,加上日益激烈的对手竞争,OpenAI 仍在亏损,据行业内估计到 2024 年底,OpenAI 的亏损将接近 50 亿美元。

天量的资金需求,靠融资过活的现实,几乎决定了 AI 赛道对于商业化的渴求:一个残酷的现实是,如果融不到钱,被大厂收购已然是正在发生的事实。8 月 3 日,Google 官宣'收购'Character AI 并收编团队,而 Adept 和 Inflection AI 在不久前分别卖身亚马逊和微软。

与海外的情形类似,国产 AI 也在压力中艰难前行,从最新的消息来看,百川与月之暗面分别完成了数十亿人民币的融资,估值也来到了 200 亿以上的区间,但从实际盈利来看,这些明星独角兽似乎依旧乏善可陈。

与海外大厂激进的投资策略不同,国内大厂对于 AI 的态度似乎开始转向。从早期的 FOMO(fear of missing out)中回过神,国内大厂并没有选择进一步夸张的投入,而是逐渐开始对 AI 应用以及商业化的挖掘。

价格战之后,拥有智能云业务以及场景优势的大厂,分别以此为基线开始了全新的探索,以阿里为例,据业内人士表示,阿里云在芯片禁令收紧以前进口了大批英伟达大卡(H 系列、A 系列),总数超过了 10 万张(包括其海外分支机构的卡)。其中只有一部分是用于内部训练,大部分则以出租的形式提供给外部平台。有投资人直接表示'很多云厂商的大模型业务都是搭着免费送的。'似乎也显示出了,当下赛道内的实际情形。

与此同时,豆包的逐渐走红,也让字节看到了自身在产品方向上的优势。近日,抖音搜索的出现,也让外界浮想联翩。与此同时,据业内人士表示,腾讯除了混元大模型,微信自己还搞了一个大模型,与混元团队完全分开。目前只能通过微信搜一搜:有时候微信会帮你总结你的搜索内容(灰度测试,不保证所有人都被测试到),其背后的大模型一半是混元的,一半是微信的。

由此可见,面对这场越来越昂贵的游戏,大厂并没有选择大规模投资,而是开始了更多的选择赋能自身业务,商业化的诉求和克制的投入,可能成为未来一段时间,大厂对于大模型以及 AI 赛道主要的策略。

而从此基础上来看百度的流言,似乎又有了一重不同的视角,对于 AI 影响最为深远的赛道,主营业务为搜索的百度,显然面对的压力更大。从财报来看,第二季度百度最大的收入来源线上广告业务收入为 192 亿元,同比下滑 2%。而另一个业务重心,百度云当季收入为 51 亿元,其中,9% 的收入来自外部客户对大模型和生成式 AI 相关服务的需求。显然 AI 对于业务的赋能,似乎助推力度并不能令人满意。

在自媒体市象的报道之中,百度内部的态度,似乎也与主流厂商一致'或者这么说吧,训练下一代模型不是百度的第一优先级。'但'老板明确表示,我们绝不会下 table。'

AI 虽好,但单纯以 ROI 来看,似乎并不适合孤注一掷,而何时打破当下的格局,抛开客观条件限制,AI 应用就成了最重要的变量。

AI 应用的纠结和逆风期

关于 AI 应用的风口,从年初以来,似乎从未停止。

金句不断地投资人朱啸虎,无疑是这波 AI 应用的旗手之一。在 2024 年初的演讲中,AI 应用肯定爆发,每轮周期最后,应用赚的钱是前面的 10 倍。作为曾经投出过滴滴、饿了么的成功投资人,朱啸虎的逻辑非常直接,大模型的商业模式很差,未来盈利主要在 AI 应用。

'每一代模型你都要重新去砸钱,而且你变现周期可能就两三年,这比发电厂还要差。'朱啸虎对于大模型的态度并不乐观,但对于可以直接变现,由用户买单的 AI 应用,却始终称赞有加。

而另一个在 AI 应用的支持者,则是百度创始人李彦宏,在 7 月的演讲中,大模型的重点还是'卷应用','没有应用,光有基础模型,不管是开源还是闭源都一文不值。'

两个旗手虽然都支持 AI 应用,但从路线上,似乎并不相同,朱啸虎偏爱 PMF(product market fit)明确,直接可以 TOB 变现的尖叫应用,如垂直于 AI 面试的近屿智能,或是垂直于视觉类产品的 FancyTech,用他的话说'以前中国软件市场为什么规模化很慢,因为销售周期很长,要 6-12 个月,不可能很快的。但现在能让企业用户有这种尖叫效应的话,它变现周期也很快。从微信拉群介绍到签单,一两个月时间。'

而李彦宏则更钟爱 agent 智能体,他认为,医疗、教育、金融、制造、交通、农业等各行业领域,未来都会依据自身场景和特有经验、规则、数据等,做出各种智能体,将会出现数百万量级的智能体,形成庞大生态。

但朱啸虎却对智能体保持怀疑态度,在与界面的访谈之中,朱啸虎坦言,AI Agent 不能落地,因为大模型天然有幻觉,单步的错误率可能在 10%-20%,5 步推理以后可能错误率就 50% 以上了,就完全没法用。那你高 50% 同样也没用,错误率百分之二三十还是没法落地,不改变本质问题。

AI 应用的路线争端还在继续,从更宏观的维度,似乎 AI 应用也遭遇了逆风期,在摩根士丹利的名为《中国 AI 面临更大的变现问题》中,大摩表示,AI 应用发展慢于预期,货币化更加艰难。

在报告中显示,在宏观环境的背景之下,企业和消费者难以接受 AI 功能带来的价格上涨。同时,免费 AI 服务的竞争加剧了盈利压力。与此同时,AI 产品与客户期望存在差距。缺乏高质量的领域数据训练、特定场景下表现不佳、产品尚未成熟等因素制约了 AI 应用的价值实现。不仅国内,在海外,行业领先指标不佳,AI 远未实现货币化。美国软件公司今年以来业绩令人失望,AI 相关收入贡献有限。AlphaWise 调查显示 CIO(首席信息官) 对 AI 应用投产时间表,每次调查预期都在延后。

而在国内,金山办公和万兴科技在推出 AI 产品后收入增长令人失望,反映出基础 AI 功能竞争激烈,高级应用尚未成熟。两家公司表示将继续加大研发投入,意味着盈利前景仍不明朗。

总结来看,AI 应用仍还在探索期,无论大厂还是投资人,似乎还在挖掘其内在的潜力,共识并未达成之下,从变现来看,也许投资人追逐的商业模式更为安全,但技术的进步,似乎也在逐渐让变量进一步加深,以当下的视角来看,AI 应用的爆发期,仍然没有到来,这也意味着,试图通过 AI 应用爆发达成的商业计划,正在被延迟。

越来越复杂的路线之争

9 月 13 日,Open AI 发布了全新一代的大模型预览版,这个在内部代号为'草莓'的模型,在问世的一瞬间,还是激起了业内的震动。

从模型效果反馈上来看,这个名为 Open AI o1 的产品可以说是石破天惊的存在。作为首个具有'推理'能力的大模型,它能通过类似人类的推理过程来逐步分析问题,直至得出正确结论。

根据 OpenAI 官网的评测,这款模型尤其擅长处理数学和代码问题,甚至在物理、生物和化学问题基准测试中的准确度超过了人类博士水平。

而从业内人士的反馈来看,此次 Open AI o1 的出现,则可能代表了硅谷在 AGI 范式正在发生转移,纯靠语言模型预训练的 Scaling Law 这个经典物理规律在遭遇到算力与参数无法大幅提升等瓶颈后,多家硅谷明星公司已经把它们的资源重心押宝在一条新路径上:self-play RL(自博弈强化学习)。而 Open AI o1 似乎就是这样一款产品。

具体来说,根据业内人士解释来看,o1 模型就像在不同的可能性中反复'抽样',每次推导出一个更好的结果。打个比方,你问它一个复杂的数学问题,它不会一秒钟给你答案,而是像个认真思考的人,先把问题分解成好几步,一步步推理。这样做的好处,答案通常更准确、更有逻辑,尤其是在科学推理、编程和数学题目上表现非常好。比如,在国际数学奥林匹克测试中,o1 的解题正确率达到 83%,而之前的 GPT-4o 只有 13%。这说明它在处理复杂问题时,确实有了质的提升。

今年以来,多模态、10 万卡集群的超级模型,以及自博弈强化学习等多条路径开始在硅谷 AI 界发生变革,共识被打破之后,当下来看依旧没有标准答案。

从当下的信息来看,未来如何能达到 AGI 原本的共识似乎正在被打破。尽管 o1 模型还有诸多疑问,但从 AGI 进化的步伐来看,似乎出现了多重可能性。当然,这对于资金与人才优势明显的硅谷来说,是好事,但相反对于追随者而言,则意味着挑战难度正在加大。

从终局思维来看,国产 AI 在未来将不得不再次面临技术方向的选择,而更大规模地投入似乎也势在必行。烧钱打仗虽然不会发生在当下,但在未来却是成功的关键。

从这个角度来看,无法造血的公司,淘汰的几率显然会更大,国产大厂可以通过现金奶牛业务继续维持跟随战略,但成本的逐渐增加,以及方向不明的变现路径,都可能成为阻碍发展的绊脚石。类似于百度今天面对的谣言,似乎也正是其需要应对的问题。但解法如何,似乎仍并不明朗。

国产大模型的破局之路

面对高昂的成本与不确定的回报,国产大模型厂商需要在战略上进行深刻的调整。首先,必须正视算力资源的稀缺性。随着全球高端 GPU 供应受限,单纯依赖硬件堆叠的 Scaling Law 红利正在消退。未来的竞争将更多体现在如何利用有限的算力资源,通过算法优化、数据质量提升以及推理效率改进来降低成本。

其次,应用场景的深耕是关键。通用大模型如同水电煤基础设施,其价值在于赋能千行百业。国内大厂应利用自身在电商、社交、金融等领域的深厚积累,构建垂直行业的专用模型。例如,在医疗领域结合专业知识库提供辅助诊断建议,在金融领域提供合规的风险评估工具。这种'模型 + 场景'的深度绑定,不仅能提高用户粘性,还能通过解决具体痛点实现商业闭环。

此外,开源生态的建设也不容忽视。通过开放部分模型权重或推理框架,吸引开发者社区共同完善生态,可以降低单一企业的研发成本,同时扩大技术影响力。对于中小型企业而言,基于开源模型进行微调和应用开发,是降低门槛的有效途径。

最后,政策监管与数据安全也是不可忽视的因素。随着 AI 法规的完善,合规成本将逐渐纳入考量。企业在追求技术创新的同时,必须建立严格的数据治理体系,确保模型训练与应用符合法律法规要求,避免因合规风险导致的业务中断。

综上所述,大模型赛道正处于从狂热走向理性的转折期。大厂养不起大模型并非指完全停止投入,而是指不再盲目追求规模扩张,转而寻求高质量、可持续的发展模式。唯有在成本控制、应用落地与技术突破之间找到平衡点,才能在未来的 AI 竞争中占据有利位置。

目录

  1. 越来越昂贵的“游戏”
  2. AI 应用的纠结和逆风期
  3. 越来越复杂的路线之争
  4. 国产大模型的破局之路
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • C++/WinRT 教程 (1):初识 WinRT 程序
  • 自然语言处理在金融领域的实战应用
  • OpenClaw 框架 30+ 真实场景实战拆解
  • C++ 异常处理机制详解与实战
  • C++ 实现通用字符串分割 split 函数
  • FPGA 入门:Vivado/Vitis 2023.1 软件安装指南
  • 数据结构实战:C 语言循环双向链表实现详解
  • 哈希算法:冲突解决与高效查找
  • 前端程序员转型大模型工程师的实战指南
  • AI 大模型技术白皮书:发展趋势、挑战与展望
  • 降低 AIGC 率的 Prompt 指令策略与代码实践
  • 从决策树到随机森林:原理、实现与可解释性解析
  • C++ 函数重载:核心规则、实现细节与实战
  • Scrapling Python 网页抓取库使用指南
  • OpenClaw 多会话管理与子代理功能详解
  • DeepSeek 中冷启动数据与多阶段训练的作用
  • PostCSS px-to-viewport 移动端适配实战指南
  • 基于 LLaMA-Factory 的大模型 LoRA 微调实战指南
  • Rust 异步代码的测试与调试实践
  • 基于 vLLM+Open-WebUI 部署 Qwen3-Embedding-4B 实践

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online