大模型混战时代互联网企业的转型与应对策略
在人工智能技术飞速发展的今天,大模型(Large Language Models, LLM)已成为行业关注的焦点。回顾历史,IBM 总裁曾预测全世界只需要五台计算机,这一观点在当时看来极具前瞻性。如今,随着云计算和大模型的普及,全球算力资源正逐渐向少数头部平台集中。行业普遍预测,未来十年内,全球可能只剩下少数几个主导性的大模型生态。这种集中化趋势不仅源于技术壁垒,更受限于能源消耗和资金投入。
本文探讨了大模型混战时代互联网企业的转型方向与应对策略。文章指出,随着算力成本高昂及资源集中化,行业正从 To C 转向 To B 的产业互联网。企业面临算力短缺、技术同质化等挑战,需通过云算力服务解决硬件瓶颈。成功的关键在于技术与行业理解的深度融合,包括数据治理、模型微调、RAG 技术应用及推理优化。最终,企业应构建开放生态,注重安全合规与全球化布局,以实现可持续的产业升级。

在人工智能技术飞速发展的今天,大模型(Large Language Models, LLM)已成为行业关注的焦点。回顾历史,IBM 总裁曾预测全世界只需要五台计算机,这一观点在当时看来极具前瞻性。如今,随着云计算和大模型的普及,全球算力资源正逐渐向少数头部平台集中。行业普遍预测,未来十年内,全球可能只剩下少数几个主导性的大模型生态。这种集中化趋势不仅源于技术壁垒,更受限于能源消耗和资金投入。
训练大模型所需的超级计算机是名副其实的'吞电兽',其耗电量可达兆瓦级。此外,构建和维护大模型需要巨额的资金和顶尖的人力资源投入。行业内流传着一种说法:'人工智能每收获一元投资,就有六毛钱流向了大模型'。在能源和资源有限的前提下,产业集中化是必然趋势。截至 2023 年 10 月,我国拥有 10 亿参数规模以上大模型的厂商及高校院所已达到 254 家,涵盖了通用大模型(AGI)和垂直大模型。这意味着每隔几天,国内就会官宣一个新的大模型版本。
随着'百模大战'进入后半场,行业过滤分层将更为剧烈。只有手握硬核实力和资源的企业才能生存下来。大模型究竟要实现何种价值?在实现价值之前,我们需要突破哪些困难?
复盘过去一年,大模型的热点经历了三次演变:
对于国产大模型而言,核心课题已从'能不能做出来'转变为'如何落地'。行业的答案是更快地理解 To B 行业,赋能垂直领域创新。这与互联网产业的发展轨迹不谋而合。中国互联网在个人领域的渗透率已超九成,消费互联网接近流量天花板。随着红利减缓,航线正从 To C 驶向 To B,即产业互联网。
互联网企业在选择大模型合作伙伴时,首要考虑的因素是算力。大模型是巨量参数的结晶,与大算力密不可分。虽然国内大模型在对话层面已接近 GPT-3.5,但在复杂指令处理上与 GPT-4 仍有差距。向上升级意味着需要相匹配的算力底座。
AI 行业 2012 年至 2023 年算力需求翻了数十万倍,以 GPU 为核心的 AI 芯片掌握着企业命脉。然而,国内厂商提升算力面临重重阻碍:
为缓解算力焦虑,云服务提供商推出了弹性算力方案。例如,通过昇腾 AI 云服务或类似架构,企业可一键接入获取 AI 算力。主流云平台已布局多个主节点及分节点,支持超过十万卡大规模集群,兼容业界主流 AI 框架。这意味着企业无需单纯依赖'买卡',即可实现算力的即开即用和可持续使用。
互联网企业选择大模型布局时,技术能力是关键。产业互联网更趋向理性,强调价值而非规模。流量为先的产品思维不再适用,需综合技术能力、行业理解、商业模式升级及安全合规为一体。
当前部分互联网企业研发投入不足,缺乏自主知识产权的核心技术,导致产品和服务同质化。为助力产业升级,需要提供一套可行、可靠的解决方案:
大模型发展需要融合产业力量。通过开源打造开放生态,形成公共联合体和商业闭环,加快软硬边端云的全面融合。目前,已有多个行业大模型联创案例,汇聚了大量开发者和解决方案。同时,依托全球化经验优势,提供安全合规、本地运营等服务,帮助企业稳健出海。
对于希望利用大模型实现产业升级的互联网企业,除了关注算力和生态,还需明确具体的技术实施路径。
高质量的数据是大模型落地的基石。企业需建立数据治理体系,清洗、标注并结构化内部数据。针对垂直领域,需构建专属知识库,确保数据的时效性和准确性。数据隐私和安全合规也是重中之重,需符合相关法律法规要求。
根据业务场景选择合适的基座模型。对于通用任务,可直接调用 API;对于特定领域,需进行微调(Fine-tuning)。微调过程包括数据准备、预训练、指令微调等步骤。企业应评估自身算力储备,决定采用全量微调还是参数高效微调(PEFT)。
为解决大模型幻觉问题,RAG 技术成为重要补充。通过外挂知识库,让模型在回答时检索相关文档片段,提高回答的准确性和可追溯性。这适用于客服问答、文档查询等场景,能有效降低对模型训练数据的依赖。
在生产环境中,推理成本往往高于训练成本。企业需采用量化、蒸馏等技术降低显存占用,提升推理速度。同时,设计高可用架构,支持弹性伸缩,以应对流量波动。监控模型性能指标,持续迭代优化。
走向产业不是单打独斗,大模型为互联网提供了全新的工具,而互联网向产业转型升级的过程中,安全可靠的生态构建也是必经之路。新时期下,互联网企业从'比流量'、'比用户量'的野蛮增长阶段,进入到'比实力'、'比耐力'、'比竞争力'的新时期。面对算力约束和技术挑战,唯有深化行业理解,构建开放生态,才能在新一轮技术变革中找到第二增长曲线。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online