开源大模型重塑企业 AI 应用：16 个落地案例解析

综述由AI生成探讨了开源大型语言模型（LLM）在企业中的应用现状、挑战及落地案例。文章分析了开源模型在反馈循环、数据隐私及部署方面的难点，指出企业倾向于混合使用开源与封闭模型以平衡控制力与性能。通过 VMware、IBM、Wells Fargo 等 16 家企业的实际案例，展示了开源 LLM 在代码生成、客户服务、内容创作等领域的具体实践，强调了微调与私有化部署的重要性。未来趋势显示，企业将采用混合策略，建立 AI 协调层，动态选择最佳模型，开源 LLM 将成为企业数字化转型的关键基础设施。

暖阳发布于 2025/2/6更新于 2026/6/227 浏览

开源大模型重塑企业 AI 应用

随着性能优异的大模型横空出世，开源大型语言模型（LLM）在企业界的应用逐渐引起广泛关注。然而，这也带来了新的问题：企业应如何有效地部署和应用这些模型以发挥最大价值？

VentureBeat 和其他专家认为，开源 LLM 可能会对企业中的生成式人工智能产生更强大的影响，甚至可能超过 OpenAI 的 ChatGPT 或 Anthropic 等封闭模型。尽管有许多实验或概念验证，但相对较少的成熟公司公开宣布已在实际商业应用中部署开源模型。

开源大模型面临的挑战

反馈循环存在延迟

开源大模型的发展和部署面临一些延迟，部分原因是起步较慢。例如，Meta 的 Llama 在 2023 年 2 月发布，而 OpenAI 的 ChatGPT 则在 2022 年 11 月就已公开。虽然开源模型的实际应用案例现在还相对较少，但它们正紧咬封闭模型，追赶上来只是时间问题。

开源模型当前还存在局限性。Replit 的 CEO Amjad Masad 指出，反馈循环无法正常工作，因为人们不能轻松地为模型开发做出贡献。不过，开源领域的实验和创新活动正在加速，开发者们正在创建越来越多基于开源模型的衍生产品，它们在某些指标上逐步实现与封闭模型的性能平起平坐甚至超越。

大型公共模型本身对企业几乎没有价值

Dell 的 AI 战略高级副总裁 Matt Baker 直言不讳地指出了封闭模型的局限性。Baker 表示：「大型公共模型本身对私营公司几乎没有什么价值。」他指出，这些模型目标是非常通用的模型，这会使它们变得臃肿，且不允许企业用户轻松访问自己的数据。

Baker 估计，企业所做的人工智能工作中，约有 95% 是通过检索增强生成（RAG）等技术为模型注入数据所需的工作流程。即便如此，RAG 也并不总是可靠的。许多企业正在构建和试验基于开源的客户支持和代码生成应用程序，以与它们自己的定制代码互动，有时这些代码对于由 OpenAI 或 Anthropic 等公司构建的通用封闭 LLM 来说是难以理解的。

部署起跑缓慢的其他原因

Hugging Face 可以说是开源 LLM 最大的聚集地。不过，Hugging Face 负责为使用开源 LLM 的公司提供建议的 Andrew Jardine 说，企业需要首先考虑数据隐私、客户体验和伦理等方面的影响，才能推进对 LLM 应用程序的使用。企业倾向于首先在内部用例上测试 LLM，通过概念验证后，才会考虑外部用例的部署。

也有人支持企业应该远离开源，因为从 OpenAI 调用 API 等服务更简单，不需要处理开源许可和治理的挑战。此外，GPT 模型虽然在多语言处理上表现良好，但开源 LLM 的效果参差不齐。

Jardine 提到，这样的对立二分法是个错误的观念，因为现在大部分企业都会将二者一起使用。他提到了最近与他交谈的一家大型制药公司，该公司对内部聊天机器人使用封闭模型，但使用 Llama 进行相同的用例，比如标记含有个人可识别信息的消息。它之所以这样做，是因为开源给公司提供了更多控制数据的权力。

开源将迎头赶上

技术的发展十分迅速，商业的需求改变也变幻莫测，这使企业想要根据需求在不同的开源和封闭模型之间切换。他们已经意识到了，只依赖一种模型会带来风险。如果模型提供商突然更新模型，或者没有及时更新模型跟上时代的步伐，公司的客户都可能会受到负面影响。

当公司担心控制数据访问权限，同时又希望对模型进行微调以达到专门目的时，通常会选择开源途径。「你可以使用自己的数据对模型进行微调，使其更适合你。」

Intuit 和 Perplexity 希望希望在单一应用中使用多个模型，以便挑选对特定子任务有利的大模型。这些公司已经建立了生成式 AI「协调层」，通过调用完成任务的最佳模型，自主完成这项工作，开源模型或是封闭模型都可以。

部署开源模型的其他挑战

真正部署企业的源代码示例也很棘手，因为 LLM 的应用程序处于一种找不到甲方的状态。他们寻找的对象是 LLM 技术的「最终用户」，而不是供应商。

另一个挑战是如何定义开源。Meta 于 2023 年 7 月发布了 Llama 2，该版本不仅可用于研究，也允许用于商业，但仍有一些限制。Llama 只公开了其模型权重，没有发布如数据源、训练代码或微调方法等具体细节。因此，有一些纯粹的开源主义者认为，Llama 不应该被认为是真正的开源。

Writer 开发了自己的 LLM 家族，称为 Palmyra，用于支持人们快速、创造性地生成内容的应用程序。虽然 Writer 已经开源了其中的两个模型，但其主要的 Large Palmyra 模型仍然是封闭的，并且是这些企业客户默认使用的。

企业落地案例展示

最近几个月，从初创公司涌现出大量针对企业的新开源 LLM，包括 Deci 和 Together 的 Redpajama 推出的产品。即使是微软、亚马逊的 AWS 和谷歌也加入了供应游戏，像麦肯锡这样的咨询公司也利用部分开源 LLM 为客户构建应用程序。

VentureBeat 尽可能收集了他们所能找到的示例，并进行了整理：

VMWare：部署了 HuggingFace 的 StarCoder 模型，该模型可帮助开发人员生成代码，从而提高开发效率。VMWare 选择自行托管该模型，而不是使用像微软拥有的 Github 的 Copilot 这样的外部系统。这可能是因为 VMWare 对其代码库非常敏感，不希望让微软访问它。

开源大模型重塑企业 AI 应用：16 个落地案例解析

开源大模型重塑企业 AI 应用

开源大模型面临的挑战

反馈循环存在延迟

大型公共模型本身对企业几乎没有价值

部署起跑缓慢的其他原因

开源将迎头赶上

部署开源模型的其他挑战

企业落地案例展示

更多推荐文章

相关免费在线工具

总结与展望

更多推荐文章

相关免费在线工具

开源大模型重塑企业 AI 应用：16 个落地案例解析

开源大模型重塑企业 AI 应用

开源大模型面临的挑战

反馈循环存在延迟

大型公共模型本身对企业几乎没有价值

部署起跑缓慢的其他原因

开源将迎头赶上

部署开源模型的其他挑战

企业落地案例展示

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

总结与展望

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具