LangChain 输出解析器与 LCEL 链构建详解 | 极客日志

PythonAI

LangChain 输出解析器与 LCEL 链构建详解

综述由AI生成LangChain 框架中的输出解析器（OutputParser）和 LangChain 表达式语言（LCEL）。内容涵盖为何需要输出解析器以实现结构化数据输出，如何使用内置解析器及自定义 Pydantic 模型解析器。重点阐述了 LCEL 的概念，通过 Runnable 接口和管道符 | 实现组件的高效组合，对比了传统调用方式与 LCEL 的差异。此外，还补充了 LCEL 的异步支持、流式输出、错误处理及性能优化等高级特性，旨在帮助开发者构建更稳健的大模型应用。

技术博主发布于 2025/2/6更新于 2026/5/2917 浏览

LangChain 输出解析器与 LCEL 链构建详解

本文详细介绍 LangChain 框架中的核心组件：输出解析器（OutputParser）的使用，以及如何基于 LangChain 表达式语言（LCEL）构建高效的链（Chain）。通过掌握这些技术，开发者可以更灵活地控制大模型（LLM）的输出格式，并简化应用开发流程。

1. 输出解析器 OutputParser

1.1 为什么需要 OutputParser

在常规使用 LangChain 构建 LLM 应用的流程中，通常遵循 Prompt 输入 -> 调用 LLM -> LLM 输出 的模式。然而，在实际业务场景中，我们往往期望 LLM 返回的数据是结构化的，以便后续程序进行精确处理（如存入数据库、触发 API 调用等）。

如果仅依赖自然语言回复，后续解析将变得困难且不稳定。此时，我们需要在 Prompt 中预设格式要求，并利用输出解析器将 LLM 的原始文本转换为预期的数据结构。输出解析器充当了 LLM 输出与应用程序之间的桥梁。

1.2 代码实践

调用系统自带的输出解析器

LangChain 提供了一些内置的解析器，例如 CommaSeparatedListOutputParser，用于将结果解析为逗号分隔的列表。

示例：获取城市景点列表

from langchain_openai import ChatOpenAI
from langchain.output_parsers import CommaSeparatedListOutputParser
from langchain.prompts import ChatPromptTemplate

# 定义提示模板
prompt = ChatPromptTemplate.from_messages([
    ("system", "{parser_instructions}"),
    ("human", "列出{cityName}的{viewPointNum}个著名景点。")
])

# 初始化解析器
output_parser = CommaSeparatedListOutputParser()
parser_instructions = output_parser.get_format_instructions()
print("解析器指令:", parser_instructions)

# 生成最终 Prompt
final_prompt = prompt.invoke({
    "cityName": "南京",
    "viewPointNum": 3,
    "parser_instructions": parser_instructions
})

# 调用模型
model = ChatOpenAI(
    model="gpt-3.5-turbo",
    openai_api_key="YOUR_API_KEY",
    openai_api_base="https://api.openai.com/v1"
)
response = model.invoke(final_prompt)
print(, response.content)


ret = output_parser.invoke(response)
(, ret)

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

from typing import List
from langchain.output_parsers import PydanticOutputParser
from langchain.prompts import ChatPromptTemplate
from langchain.schema import HumanMessage
from langchain_core.pydantic_v1 import BaseModel, Field
from langchain_openai import ChatOpenAI

# 1. 定义数据结构
class BookInfo(BaseModel):
    book_name: str = Field(description="书籍的名字")
    author_name: str = Field(description="书籍的作者")
    genres: List[str] = Field(description="书籍的体裁")

# 2. 初始化解析器
output_parser = PydanticOutputParser(pydantic_object=BookInfo)
print("格式指令:", output_parser.get_format_instructions())

# 3. 构建 Prompt
prompt = ChatPromptTemplate.from_messages([
    ("system", "{parser_instructions} 你输出的结果请使用中文。"),
    ("human", "请你帮我从书籍的概述中，提取书名、作者，以及书籍的体裁。书籍概述会被三个#符号包围。\n###{book_introduction}###")
])

book_introduction = """
《朝花夕拾》原名《旧事重提》，是现代文学家鲁迅的散文集，收录鲁迅于 1926 年创作的 10 篇回忆性散文。
此文集作为'回忆的记事'，多侧面地反映了作者鲁迅青少年时期的生活。
"""

# 4. 执行链
model = ChatOpenAI(model="gpt-3.5-turbo", openai_api_key="YOUR_API_KEY")
final_prompt = prompt.invoke({
    "book_introduction": book_introduction,
    "parser_instructions": output_parser.get_format_instructions()
})
response = model.invoke(final_prompt)
result = output_parser.invoke(response)

print(result)
# 输出类型为 BookInfo 对象

# 传统写法
final_prompt = prompt.invoke({"book_introduction": book_introduction, "parser_instructions": output_parser.get_format_instructions()})
response = model.invoke(final_prompt)
result = output_parser.invoke(response)

# LCEL 写法
chain = prompt | model | output_parser
ret = chain.invoke({
    "book_introduction": book_introduction,
    "parser_instructions": output_parser.get_format_instructions()
})

import asyncio

async def main():
    # 使用 ainvoke 替代 invoke
    result = await chain.ainvoke({
        "book_introduction": book_introduction,
        "parser_instructions": output_parser.get_format_instructions()
    })
    print(result)

asyncio.run(main())

for chunk in chain.stream({
    "book_introduction": book_introduction,
    "parser_instructions": output_parser.get_format_instructions()
}):
    print(chunk, end="", flush=True)

LangChain 输出解析器与 LCEL 链构建详解

LangChain 输出解析器与 LCEL 链构建详解

1. 输出解析器 OutputParser

1.1 为什么需要 OutputParser

1.2 代码实践

调用系统自带的输出解析器

更多推荐文章

相关免费在线工具

自定义格式的输出解析器

2. 利用 LCEL 构建链

2.1 LCEL 简介

2.2 传统方式与 LCEL 对比

不使用 LCEL

使用 LCEL

2.3 LCEL 的高级特性

异步支持

流式输出

3. 最佳实践与常见问题

3.1 错误处理

3.2 性能优化

3.3 调试技巧

4. 总结

更多推荐文章

相关免费在线工具

LangChain 输出解析器与 LCEL 链构建详解

LangChain 输出解析器与 LCEL 链构建详解

1. 输出解析器 OutputParser

1.1 为什么需要 OutputParser

1.2 代码实践

调用系统自带的输出解析器

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

自定义格式的输出解析器

2. 利用 LCEL 构建链

2.1 LCEL 简介

2.2 传统方式与 LCEL 对比

不使用 LCEL

使用 LCEL

2.3 LCEL 的高级特性

异步支持

流式输出

3. 最佳实践与常见问题

3.1 错误处理

3.2 性能优化

3.3 调试技巧

4. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具