概述
2024 年在新的 AGI 和生成式 AI 机会方面肯定会充满希望。
据《福布斯》报道,下一代生成式人工智能将成为 2024 年的前 5 大趋势,与增强工作、道德人工智能、人工智能立法和量子人工智能竞争。因此,就人工智能实施的新方式而言,2024 年听起来确实很有希望,特别是对于希望实施 GPT、Bard 或其他闭源大型语言模型的公司而言。
OpenAI GPT 用户场景
OpenAI 的 GPT 作为 GenAI 行业主要的大型语言模型领导者,已经通过在许多不同的软件解决方案中实施 GPT 3 证明了其强大功能。其追随者 GPT-3.5 最初用于著名的 ChatGPT,在大语言建模方面取得了显著的进步。
我们可能会看到成百上千家新的基于 ChatGPT 的初创公司在 2023 年推出。这似乎是一种新的基于 OpenAI 的创业趋势,它让 AI 初创公司市场充满了不同有趣的解决方案,从将 ChatGPT 集成到 Chrome 扩展程序开始,到以正在进行的 GPT-4 微调模型已集成到 LMS 中。
LLM 用户场景是无边界的。GPT-3.5 API 和 GPT-4 API 可以集成到旅游企业、房地产、酒店、电子商务、客户支持聊天机器人和许多其他领域。
ChatGPT API 集成的另一个很好的例子是销售和营销 SaaS。该领域的许多初创公司已经将 ChatGPT 实施到他们现有的解决方案中,我们可能会看到大量新公司每天都在实施人工智能。
根据 Statista 的数据,在其业务中使用 ChatGPT 的前 10 个行业是技术、教育、商业服务、制造、金融、零售、医疗保健、政府、媒体和建筑。2024 年似乎也会如此。
OpenAI 的 CEO Sam Altman 已经宣布了 GPT-5 的开发,并考虑到他们将微软指定为这条道路的主要合作伙伴,这应该是超级智能的东西,并且显然更像人类(Tom's Guide)。因此,这绝对是其他行业加入人工智能企业的新途径。
开源 LLM 初创公司
你有没有想过,著名的 ChatGPT、Bard、Cohere 都是闭源的大语言模型例子?这意味着它们只能在其所有者提供的编码功能中使用,并且不能由我们的开发团队和特定需求进行完全修改。
然而,越来越多的开源 LLMs 可以作为封闭源代码的绝佳替代品,为初创企业和企业带来好处。让我们更深入地探讨这一点,看看初创公司如何使用开源大语言模型。
据 Finxter 报道,2023 年最常用的开源 LLMs 是:
- OPT-180B
- BLOOM-341B
- LLaMa-1.4T
- MPT-1T
- Falcon-1.5T
- LLaMA 2-2T
开源大型语言模型的最大优势之一是它们在执行时间方面可以快得多。例如,闭源 ChatGPT 有时需要长达 13 秒才能进行查询,而像 LLM LaMini 这样的开源模型则需要长达 5 秒才能进行相同的查询。
开源 LLMs 被用于不同的行业,但它们确实有用,特别是在面向软件工程的初创公司中,这种趋势将在 2024 年明显增长。这种快速增长的公司的一个很好的例子是 Hugging Face。他们的平台拥有超过 25000 个模型、40000 个数据集和 50000 个演示应用程序 (Spaces)。所有这些都是开源且公开的,因此客户可以轻松协作并构建 ML 和 AI 应用。
另一种类型的开源大型语言模型用例可能是将其集成到现有软件中,而闭源 LLM 无法提供必要的结果。例如,假设您希望客户支持 AI 聊天机器人以 2 倍的速度回答传入的询问,但当前的闭源模型(如 Bard 或 GPT-3.5)无法提供所需的速度。在这种情况下,您可以查看 LLaMA 2、Falcon 或 Flan-T5 等开源模型。
因此,显然开源大型语言模型用例可能是您的新项目想法或初创公司的绝佳机会,特别是如果您的目标是在机器学习或人工智能领域创建一些最先进的解决方案。
自定义模型的解决方案
实现 GPT 和其他类型的提示工程已经成为一种趋势。但语言模型并不总是预先定义的,它们可以被定制。什么是自定义模型以及什么可以是自定义大型语言模型示例?我们来看一下。
大型语言模型是一种预先训练的机器学习模型,旨在执行各种任务:从情感分析到语言翻译。同时,自定义语言模型已经是一个经过微调的模型,或者专门针对特定领域、用例或行业进行训练的模型。自定义语言模型可用于满足业务或用例的独特需求。
自定义语言模型的细节在于微调。根据 OpenAI API 微调可以提供如下能力:
- 可以使用超出提示工程范围的更多示例来训练模型
- 比仅通过提示工程得到更好的质量结果
- 由于提示工程较短,可以节省 token
例如,OpenAI 的文本生成模型已经过大量文本的预训练。它们的微调通过对超出提示的示例进行训练来改进小样本学习,让您在大量任务上取得更好的结果。一旦模型经过微调,您就不需要在提示中提供那么多示例。这可以节省成本并实现更低延迟的请求。
因此,总的来说,我们可以通过以下方式使自定义语言模型和大型语言模型多样化。
一般来说,自定义 LLM 就像基本大语言模型的去中心化版本。让我们看看如何在不同的软件解决方案中实施它。Garper 表示,到 2025 年底,将出现近 175 ZB 的数据,这意味着企业需要花精力分析数据并找出趋势和模式。


