LangChain 输出解析器与 LCEL 链构建实战指南 | 极客日志

PythonAI

LangChain 输出解析器与 LCEL 链构建实战指南

综述由AI生成LangChain 中 OutputParser 的使用方法和基于 LCEL 构建链的技术。内容涵盖为何需要输出解析器、CommaSeparatedList 和 Pydantic 解析器的代码实践、JSON 及正则解析器的应用场景。重点阐述了 LCEL 表达式语言如何通过管道符组合组件，对比了传统 invoke 调用与 LCEL 链的差异，并补充了流式输出、异步支持及错误处理等高级特性。文章旨在帮助开发者提升大模型应用的结构化数据处理能力和代码可维护性。

樱花落尽发布于 2025/2/7更新于 2026/6/219 浏览

LangChain 输出解析器与 LCEL 链构建实战指南

本文详细介绍 LangChain 中 OutputParser 的使用，以及如何基于 LangChain Expression Language (LCEL) 构建高效的 链。通过结构化输出和链式调用，可以显著提升大模型应用的稳定性和可维护性。

1. 输出解析器 OutputParser

1.1 为什么需要 OutputParser

在常规使用 LangChain 构建 LLM 应用的流程中，通常遵循 Prompt 输入 -> 调用 LLM -> LLM 输出 的步骤。然而，很多时候我们需要 LLM 返回的数据是格式化的（例如 JSON、列表或特定对象），以便后续程序进行逻辑处理或数据库存储。

虽然可以在 Prompt 中要求 LLM 输出特定格式，但直接依赖 LLM 的文本生成往往不够稳定。这时就需要引入输出解析器。LLM 的输出内容会先传给输出解析器，解析器负责校验并转换数据为预期的 Python 对象格式。

1.2 代码实践：系统自带解析器

示例 1：逗号分隔列表

将调用 LLM 的结果解析为逗号分隔的列表。例如询问某个城市有 N 个著名景点。

from langchain_openai import ChatOpenAI
from langchain.output_parsers import CommaSeparatedListOutputParser
from langchain.prompts import ChatPromptTemplate

# 定义提示模板
prompt = ChatPromptTemplate.from_messages([
    ("system", "{parser_instructions}"),
    ("human", "列出{cityName}的{viewPointNum}个著名景点。")
])

# 初始化解析器
output_parser = CommaSeparatedListOutputParser()
# 获取解析器所需的指令格式
parser_instructions = output_parser.get_format_instructions()
print("解析器指令:\n", parser_instructions)

# 组装最终提示词
final_prompt = prompt.invoke({
    "cityName": "南京",
    "viewPointNum": 3,
    "parser_instructions": parser_instructions
})

# 调用模型
model = ChatOpenAI(
    model="gpt-3.5-turbo",
    openai_api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
    openai_api_base="https://api.aigc369.com/v1"
)
response = model.invoke(final_prompt)
(, response.content)


ret = output_parser.invoke(response)
(, ret)

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

from typing import List
from langchain.output_parsers import PydanticOutputParser
from langchain.prompts import ChatPromptTemplate
from langchain.schema import HumanMessage
from langchain_core.pydantic_v1 import BaseModel, Field
from langchain_openai import ChatOpenAI

# 1. 定义数据结构
class BookInfo(BaseModel):
    book_name: str = Field(description="书籍的名字")
    author_name: str = Field(description="书籍的作者")
    genres: List[str] = Field(description="书籍的体裁")

# 2. 初始化解析器
output_parser = PydanticOutputParser(pydantic_object=BookInfo)
print("格式指令:\n", output_parser.get_format_instructions())

# 3. 构建 Prompt
prompt = ChatPromptTemplate.from_messages([
    ("system", "{parser_instructions} 你输出的结果请使用中文。"),
    ("human", "请你帮我从书籍的概述中，提取书名、作者，以及书籍的体裁。书籍概述会被三个#符号包围。\n###{book_introduction}###")
])

book_introduction = """
《朝花夕拾》原名《旧事重提》，是现代文学家鲁迅的散文集，收录鲁迅于 1926 年创作的 10 篇回忆性散文。文集作为'回忆的记事'，多侧面地反映了作者鲁迅青少年时期的生活。
"""

# 4. 执行链
model = ChatOpenAI(
    model="gpt-3.5-turbo",
    openai_api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
    openai_api_base="https://api.aigc369.com/v1"
)

final_prompt = prompt.invoke({
    "book_introduction": book_introduction,
    "parser_instructions": output_parser.get_format_instructions()
})

response = model.invoke(final_prompt)
result = output_parser.invoke(response)

print("解析后的对象:", result)
print("书名:", result.book_name)

try:
    parsed_result = output_parser.invoke(response)
except Exception as e:
    print(f"解析失败：{e}")
    # 这里可以添加重试逻辑或降级方案

# 传统写法
final_prompt = prompt.invoke({"book_introduction": book_introduction, ...})
response = model.invoke(final_prompt)
result = output_parser.invoke(response)

# LCEL 写法
chain = prompt | model | output_parser
ret = chain.invoke({"book_introduction": book_introduction, ...})

for chunk in chain.stream({"book_introduction": book_introduction, ...}):
    print(chunk, end="", flush=True)

import asyncio

async def main():
    result = await chain.ainvoke({"book_introduction": book_introduction, ...})
    return result

# asyncio.run(main())

from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationChain

memory = ConversationBufferMemory()
conversation = ConversationChain(llm=model, memory=memory)

import logging
logging.basicConfig(level=logging.DEBUG)

LangChain 输出解析器与 LCEL 链构建实战指南

LangChain 输出解析器与 LCEL 链构建实战指南

1. 输出解析器 OutputParser

1.1 为什么需要 OutputParser

1.2 代码实践：系统自带解析器

示例 1：逗号分隔列表

更多推荐文章

相关免费在线工具

示例 2：自定义 Pydantic 格式

1.3 其他常用解析器

2. 利用 LCEL 构建链

2.1 LCEL 简介

2.2 不使用 LCEL vs 使用 LCEL

传统方式

LCEL 方式

2.3 LCEL 的高级特性

1. 流式输出

2. 异步支持

3. 状态管理

3. 常见陷阱与最佳实践

3.1 解析错误处理

3.2 上下文窗口限制

3.3 调试技巧

4. 总结

更多推荐文章

相关免费在线工具

LangChain 输出解析器与 LCEL 链构建实战指南

LangChain 输出解析器与 LCEL 链构建实战指南

1. 输出解析器 OutputParser

1.1 为什么需要 OutputParser

1.2 代码实践：系统自带解析器

示例 1：逗号分隔列表

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

示例 2：自定义 Pydantic 格式

1.3 其他常用解析器

2. 利用 LCEL 构建链

2.1 LCEL 简介

2.2 不使用 LCEL vs 使用 LCEL

传统方式

LCEL 方式

2.3 LCEL 的高级特性

1. 流式输出

2. 异步支持

3. 状态管理

3. 常见陷阱与最佳实践

3.1 解析错误处理

3.2 上下文窗口限制

3.3 调试技巧

4. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具