自从 ChatGPT 发布以来,大型语言模型(LLMs)已经获得了极大的普及。尽管你可能没有足够的资金和计算资源在你的地下室从头开始训练一个 LLM,但你仍然可以使用预先训练的 LLMs 来构建一些很酷的应用,例如:
- 可以根据为您的目的而定制的数据聊天机器人
- 与外界进行交互的个人助理分析
- 对您的文档或代码进行汇总
凭借其独特的 API 和快速的工程设计,LLMs 正在改变我们构建人工智能产品的方式。这就是为什么新的开发工具在'LLMOps'一词下随处可见,其中一个新工具是 LangChain。
什么是 LangChain?
LangChain 是一个框架,旨在通过为您提供以下内容来帮助您更轻松地构建 LLM 支持的应用程序:
- 各种不同基础模型的通用接口;
- 帮助您管理提示的框架;
- 以及用于 LLM 无法处理(例如计算或搜索)的长期内存、外部数据、其他 LLM 和其他代理的中央接口。
这是哈里森·蔡斯创建的一个开源项目。由于 LangChain 功能众多,我们将在本文中介绍 LangChain 目前的六个关键模块,以使您更好地了解其功能。
安装环境
在本教程中,您将需要安装 langchain Python 软件包,并准备好使用所有相关的 API 密钥。安装 LangChain 之前,请确保您的 Python 版本 ≥ 3.8.1 且 < 4.0。
要安装 langchain Python 包,您可以使用 pip 安装它。建议先在虚拟环境中操作以避免依赖冲突。
pip install langchain
在本教程中,我们使用的是 0.0.147 版。GitHub 库提交非常活跃;因此,请确保您拥有当前版本。全部设置完毕后,导入 langchain Python 包。
import langchain
API Keys
使用 LLMs 构建应用程序需要您要使用的某些服务的 API 密钥,并且某些 API 是付费的。
LLM 供应商 (必填): 您首先需要使用 LLM 提供程序的 API 密钥。我们目前正在经历'AI 的 Linux 时刻',开发人员必须基于主要在性能和成本之间的权衡,在专有或开源基础模型之间进行选择。
LLM 提供者: 专有和开源基础模型。
专有模型是拥有大型专家团队和大型 AI 预算的公司拥有的封闭式基础模型。它们通常比开源模型更大,因此具有更好的性能,但它们也具有昂贵的 API。专有模型提供商的示例是 OpenAI、co:here、AI21 Labs 或 Anthropic。大多数可用的 LangChain 教程使用 OpenAI,但请注意,OpenAI API(对于实验来说并不昂贵,但它)不是免费的。要获取 OpenAI API 密钥,您需要一个 OpenAI 帐户,然后在 API 密钥下'创建新的密钥'。
import os
os.environ["OPENAI_API_KEY"] = "... # insert your API_TOKEN here"
开源模型通常是较小的模型,其功能比专有模型低,但比专有模型更具成本效益。开源模型的示例包括:
- BLOOM by BigScience
- LLaMA by Meta AI
- Flan-T5 by Google
- GPT-J by Eleuther AI
作为社区中心,许多开源模型都是在 Hugging Face 组织和托管的。要获得 Hugging Face API 密钥,您需要一个 Hugging Face 帐户,并在访问令牌下创建一个'新令牌'。
import os
os.environ["HUGGINGFACEHUB_API_TOKEN"] = "... # insert your API_TOKEN here"
对于开源 LLM,您可以免费使用 Hugging Face,但是您将被限制在性能较低的较小 LLM 中。


