开源大模型正在重塑企业 AI 应用
各种性能优异的大模型横空出世,开源大型语言模型在企业界的应用也逐渐引起广泛关注。不过,这也使新的问题浮出水面,企业应该怎样有效地部署和应用这些模型来发挥它们最大的价值呢?
VentureBeat 和其他专家认为,开源 LLM 可能会对企业中的生成式人工智能产生更强大的影响。这种影响力可能超过了像 OpenAI 的 ChatGPT 或 Anthropic 这样的封闭模型。尽管有许多关于开源模型的实验或概念验证,但相对较少的成熟公司公开宣布他们已在实际商业应用中部署开源模型。
开源大模型遇到的问题
开源大模型的反馈循环存在延迟
开源大模型的发展和部署面临一些延迟,部分原因是它们起步较慢。例如,Meta 的 Llama 在 2023 年 2 月发布,而 OpenAI 的 ChatGPT 则在 2022 年 11 月就已公开。Mistral AI 的 Mixtral,一款表现优异的开源 LLM,也是在 2023 年 12 月才发布。虽然开源模型的实际应用案例现在还相对较少,但它们正紧咬封闭模型,追赶上来只是时间问题。
开源模型当前还存在一些局限性。Replit 的 CEO Amjad Masad 指出,反馈循环无法正常工作,因为人们不能轻松地为模型开发做出贡献。不过,开源领域的实验和创新活动正在加速,开发者们正在创建越来越多基于开源模型的衍生产品,它们在某些指标上逐步实现与封闭模型的性能平起平坐甚至超越(例如 FinGPT、BioBert、Defog SQLCoder 和 Phind)。
大型公共模型本身对企业几乎没有价值
Dell 的 AI 战略高级副总裁 Matt Baker 对于封闭模型的局限性直言不讳。Dell 已与 Meta 合作,帮助将开源的 Llama 2 带给企业用户。Baker 表示:大型公共模型本身对私营公司几乎没有什么价值。他指出,这些模型目标是一个非常通用的模型,这会使它们变得臃肿,但它们不允许企业用户轻松访问自己的数据。Baker 估计,企业所做的人工智能工作中,约有 95% 是通过检索增强生成(RAG)等技术为模型注入数据所需的工作流程。即便如此,RAG 也并不总是可靠的。
Baker 讲道:许多客户在问自己:等等,我为什么要为一个对我的业务知之甚少的超大型模型付费?我难道不能使用其中一个开源模型吗?顺便说一句,也许可以使用一个更小的开源模型来实现信息检索工作流。
他还谈道,许多企业公司正在构建和试验基于开源的客户支持和代码生成应用程序,以与它们自己的定制代码互动,有时这些代码对于由 OpenAI 或 Anthropic 等公司构建的通用封闭 LLM 来说是难以理解的。这些公司优先支持 Python 和其他流行的云计算语言,而牺牲了对传统企业代码的支持。
开源 LLM 部署起跑缓慢的其他原因
Hugging Face 可以说是开源 LLM 最大的聚集地。成千上万的开发者已经下载了 LLM 和其他开源工具,比如 LangChain 和 LlamaIndex 这样的库和框架,来创造他们自己的应用程序。不过,Hugging Face 负责为使用开源 LLM 的公司提供建议的 Andrew Jardine 说,企业需要首先考虑数据隐私、客户体验和伦理等方面的影响,才能推进对 LLM 应用程序的使用。企业倾向于首先在内部用例上测试 LLM,通过概念验证后,才会考虑外部用例的部署。
也有人支持企业应该远离开源,因为从 OpenAI 调用 API 等服务更简单,不需要处理开源许可和治理的挑战。此外,GPT 模型虽然在多语言处理上表现良好,但开源 LLM 的效果参差不齐。
Hugging Face 的 Jardine 在讨论到开源模型和封闭模型时说到,这样的对立二分法是个错误的观念,因为现在大部分企业都会将二者一起使用。他提到了最近与他交谈的一家大型制药公司,该公司对内部聊天机器人使用封闭模型,但使用 Llama 进行相同的用例,比如标记含有个人可识别信息的消息。它之所以这样做,是因为开源给公司提供了更多控制数据的权力。Jardine 说,该公司担心,如果封闭模型与敏感数据互动,那些数据可能会被发送回封闭模型提供商。
开源将迎头赶上
技术的发展十分迅速,商业的需求改变也变幻莫测,这使企业想要根据需求在不同的开源和封闭模型之间切换。他们已经意识到了,只依赖一种模型会带来风险。Jardine 说,如果模型提供商突然更新模型,或者没有及时更新模型跟上时代的步伐,公司的客户都可能会受到负面影响。他说,当公司担心控制数据访问权限,同时又希望对模型进行微调以达到专门目的时,通常会选择开源途径。你可以使用自己的数据对模型进行微调,使其更适合你。
VentureBeat 发现,有几家公司,如 Intuit 和 Perplexity,它们就希望在单一应用中使用多个模型,以便挑选对特定子任务有利的大模型。这些公司已经建立了生成式 AI 协调层,通过调用完成任务的最佳模型,自主完成这项工作,开源模型或是封闭模型都可以。
部署开源模型的其他挑战
真正部署企业的源代码示例也很棘手,因为 LLM 的应用程序处于一种找不到甲方的状态。虽然构建应用程序的开发人员和初创企业不少,但对于 LLM 的开发者来说,他们想要找到的是有明确应用场景的项目、至少拥有 100 名员工的成熟公司。
他们寻找的对象是 LLM 技术的最终用户,而不是供应商。
另一个挑战是如何定义开源。Meta 于 2023 年 7 月发布了 Llama 2,该版本不仅可用于研究,也允许用于商业,但仍有一些限制。Llama 是较受欢迎的开源 LLM 之一,但 Llama 只公开了其模型权重,没有发布如数据源、训练代码或微调方法等具体细节。因此,有一些纯粹的开源主义者认为,Llama 不应该被认为是真正的开源。


