LangChain 核心概念与架构详解

LangChain 是一个用于开发语言模型驱动应用程序的框架，支持数据感知和智能体交互。其核心组件包括 Schema、Models、Prompts、Indexes、Memory、Chain 和 Agent。通过链式调用和代理机制，LangChain 实现了文档问答、聊天机器人、表格查询等多种用例。详细解析了各组件的功能、设计目标及实际应用方案，涵盖从基础数据结构到高级检索增强生成（RAG）的完整技术路径，并补充了部署时的最佳实践与注意事项。

CodeArtist发布于 2025/2/7更新于 2026/7/2044 浏览

LangChain 介绍

LangChain 是一个用于开发由语言模型驱动的应用程序的框架。它旨在简化构建基于大语言模型（LLM）应用的流程，提供模块化组件以支持数据感知、智能体交互等高级功能。

LangChain 框架的设计目标

LangChain 的设计目标是让应用程序不仅通过 API 调用语言模型，还能实现以下能力：

数据感知：将语言模型连接到其他数据源，使其能够访问外部信息。
具备代理能力（Agentic）：允许语言模型与其环境交互，自主决定工具的使用。
增强应用差异化：最终让应用程序更强大，具备独特的业务逻辑。

LangChain 框架的价值支柱

组件化：LangChain 为使用语言模型所需的组件提供模块化抽象。这些组件易于使用，即使不依赖 LangChain 框架的其余部分也可单独集成。
特定用例链（Use-Case Specific Chains）：链可以被视为以特定方式组装这些组件，以便最好地完成特定用例。它们提供了一个更高级别的界面，帮助用户快速启动特定场景的开发，同时保持高度的可定制性。

LangChain 核心组件

Schema（模式）

整个代码库中使用的基本数据类型和模式。

文本（Text）

使用语言模型时，与它们交互的主要界面是文本。许多模型本质上是'文本输入，文本输出'。因此，LangChain 中的很多界面都是以文本为中心的。

聊天消息（ChatMessages）

最终用户与之交互的主要界面是聊天界面。出于这个原因，一些模型提供者甚至开始以期望聊天消息的方式提供对底层 API 的访问。这些消息有一个内容字段（通常是文本）并与用户相关联。目前支持的用户角色包括系统、人类和人工智能。

SystemChatMessage：代表信息的聊天消息应该是对 AI 系统的指令。
HumanChatMessage：代表来自与 AI 系统交互的人的信息的聊天消息。
AIChatMessage：代表来自 AI 系统的信息的聊天消息。

示例（Examples）

示例是输入/输出对，表示函数的输入以及预期的输出。它们可用于模型的训练和评估。这些可以是模型或链的输入/输出。两种类型的示例都有不同的用途。模型示例可用于微调模型。链的示例可用于评估端到端链，或者甚至可以训练模型来替换整个链。

文档（Document）

一段非结构化数据。由 page_content（数据的内容）和 metadata（描述数据属性的辅助信息）组成。

Models（模型）

LangChain 中使用的不同类型的模型。

语言模型（Language Model）

语言模型将文本作为输入并返回文本作为输出。

聊天模型（Chat Model）

聊天模型将 ChatMessages 列表作为输入并返回 ChatMessage。

文本嵌入模型（Text Embedding Model）

文本嵌入模型将一段文本作为输入，并以浮点列表的形式对该文本进行数字表示，用于语义搜索和相似度计算。

Prompts（提示）

编程模型的新方法是通过提示。'提示'指的是模型的输入。此输入很少被硬编码，而是通常由多个组件构成。LangChain 提供了几个类和函数来简化提示的构建和使用。

提示值（Prompt Value）

表示模型输入的类。'提示'是指传递给基础模型的内容。主要抽象在 LangChain 中有提示，因此所有处理文本数据。对于其他数据类型（图像、音频），还正在努力添加抽象，目前还没有。不同的模型可能需要不同的数据格式。在可能的情况下，我们希望允许在不同的模型类型中使用相同的提示。出于这个原因，我们有一个 PromptValue 的概念。这是一个类，它公开要转换为每个模型类型期望的确切输入类型的方法（目前是文本或 ChatMessages）。

LangChain 介绍

LangChain 框架的设计目标

LangChain 的设计目标是让应用程序不仅通过 API 调用语言模型，还能实现以下能力：

数据感知：将语言模型连接到其他数据源，使其能够访问外部信息。
具备代理能力（Agentic）：允许语言模型与其环境交互，自主决定工具的使用。
增强应用差异化：最终让应用程序更强大，具备独特的业务逻辑。

LangChain 框架的价值支柱

组件化：LangChain 为使用语言模型所需的组件提供模块化抽象。这些组件易于使用，即使不依赖 LangChain 框架的其余部分也可单独集成。
特定用例链（Use-Case Specific Chains）：链可以被视为以特定方式组装这些组件，以便最好地完成特定用例。它们提供了一个更高级别的界面，帮助用户快速启动特定场景的开发，同时保持高度的可定制性。

LangChain 核心组件

Schema（模式）

整个代码库中使用的基本数据类型和模式。

文本（Text）

使用语言模型时，与它们交互的主要界面是文本。许多模型本质上是'文本输入，文本输出'。因此，LangChain 中的很多界面都是以文本为中心的。

聊天消息（ChatMessages）

SystemChatMessage：代表信息的聊天消息应该是对 AI 系统的指令。
HumanChatMessage：代表来自与 AI 系统交互的人的信息的聊天消息。
AIChatMessage：代表来自 AI 系统的信息的聊天消息。

示例（Examples）

文档（Document）

一段非结构化数据。由 page_content（数据的内容）和 metadata（描述数据属性的辅助信息）组成。

Models（模型）

LangChain 中使用的不同类型的模型。

语言模型（Language Model）

语言模型将文本作为输入并返回文本作为输出。

聊天模型（Chat Model）

聊天模型将 ChatMessages 列表作为输入并返回 ChatMessage。

文本嵌入模型（Text Embedding Model）

文本嵌入模型将一段文本作为输入，并以浮点列表的形式对该文本进行数字表示，用于语义搜索和相似度计算。

LangChain 核心概念与架构详解

LangChain 介绍

LangChain 框架的设计目标

LangChain 框架的价值支柱

LangChain 核心组件

Schema（模式）

文本（Text）

聊天消息（ChatMessages）

示例（Examples）

文档（Document）

Models（模型）

语言模型（Language Model）

聊天模型（Chat Model）

文本嵌入模型（Text Embedding Model）

Prompts（提示）

提示值（Prompt Value）

LangChain 核心概念与架构详解

LangChain 介绍

LangChain 框架的设计目标

LangChain 框架的价值支柱

LangChain 核心组件

Schema（模式）

文本（Text）

聊天消息（ChatMessages）

示例（Examples）

文档（Document）

Models（模型）

语言模型（Language Model）

聊天模型（Chat Model）

文本嵌入模型（Text Embedding Model）

Prompts（提示）

提示值（Prompt Value）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

提示模板（Prompt Template）

示例选择器（Example Selectors）

输出解析器（Output Parser）

Indexes（索引）

文档加载器（Document Loaders）

文本拆分器（Text Splitters）

向量存储（Vectorstore）

检索器（Retriever）

Memory（记忆）

聊天消息历史（Chat Message History）

Chain（链）

链（Chain）

LLM 链（LLMChain）

索引相关链（Index-related chains）

Stuffing

Map Reduce

Refine

Map-Rerank

提示选择器（Prompt Selector）

Agent（代理）

工具（Tool）

工具包（ToolKit）

代理（Agent）

代理执行器（Agent Executor）

典型用例

私人助理

文档问答

提取

生成

聊天机器人

查询表格数据

文件

查询（Querying）

链（Chains）

代理（Agents）

与 API 交互

链（Chains）

代理（Agents）

萃取

评估

问题

解决方案

缺乏数据

缺乏指标

总结