PythonAI算法

LangChain 工程架构深度解析

综述由AI生成深入解析了 LangChain 的工程架构及其核心组件。内容涵盖 LangChain 的基本定义、技术栈分层（库、模板、Serve、Smith）、六大核心抽象（模型、提示、索引、记忆、链、代理）。详细阐述了从原始 API 调用到使用 SDK 的演进，重点讲解了 LCEL 表达式语言、DAG 链式调用、LangGraph 循环图结构。深入探讨了 RAG 检索增强生成的原理、关键组件及代码实现，以及 Tool 工具和 Agent 智能体的工作机制。最后补充了生产环境部署建议，包括监控、成本、延迟及安全方面的考量，为开发者构建复杂 AI 应用提供全面的技术指导。

RefactorPro发布于 2025/2/6更新于 2026/6/221 浏览

LangChain 是什么

LangChain 是一个基于开源大语言模型的 AI 工程开发框架，旨在使研究人员和开发人员能够更轻松地构建、实验和部署以自然语言处理（NLP）为中心的应用程序。它提供了多种组件和工具，可帮助用户利用最近的语言模型进展，如大型 Transformer 模型等，并且可以与 Hugging Face 等平台集成。LangChain 的核心理念是将语言模型用作协作工具，通过它，开发者可以构建出处理复杂任务的系统，并且可以高效地对接不同的数据源和应用程序接口（APIs）。

技术架构

从整体架构来看，LangChain 自下而上主要包括以下核心部分：

LangChain 库：Python 和 JavaScript 库，包含接口和集成，用于各种组件的组合，以及现成的链和代理的实现。
LangChain 模板：易于部署的各种任务的参考架构集合。
LangServe：将 LangChain 链部署为 REST API 的库。
LangSmith：开发平台，可用于调试、测试、评估和监控基于任何 LLM 框架构建的链，并与 LangChain 无缝集成。

LangChain 库核心组件

LangChain 的核心组件和能力包括六大核心抽象，用于构建复杂的 AI 应用，同时保持了良好的扩展能力。

Models（模型）
- Chat Models（聊天模型）：LangChain 提供了一个标准接口，支持聊天模型。这些模型是语言模型的变体，其接口基于消息而不是原始文本。您可以使用不同类型的消息（如 AIMessage、HumanMessage、SystemMessage 和 ChatMessage）与聊天模型进行交互。
- Embeddings（嵌入）：帮助将文本转换为向量表示，以便在应用程序中进行处理。
- LLMs（大型语言模型）：LangChain 支持大型语言模型，例如 GPT 系列，用于各种自然语言处理任务。
Prompts（提示）
- Prompt Templates（提示模板）：提供结构化的提示词管理方式，适用于不同任务场景。
Indexes（索引）
- Vector Databases（向量数据库）：用于存储和检索向量表示，例如文本嵌入。
- Interaction Layer Prompts（交互层提示）：用于构建用户与模型之间的交互逻辑。
Memory（记忆）
- External Knowledge（外部知识）：整合外部知识源，丰富模型的知识库。
- External Tools（外部工具）：与外部环境进行交互，例如通过 API 请求执行操作。
Chains（链）
- LangChain 提供了 LCEL（LangChain Expression Language）声明式编程语言，将不同组件组合起来解决特定任务，例如在大量文本中查找信息。
Agents（代理）
- 使得 LLMs 能够与外部环境进行交互，例如通过 API 请求执行操作，实现自主决策。

总之，LangChain 是一个强大的工具箱，不仅涵盖了基础工具，还为个性化需求提供了自定义组件解决方案。它使开发者能够更专注于创新和优化产品功能，从原型到生产环境的转化变得更加高效。

使用例子

最原始的 RESTful API vs LangChain SDK

直接调用 OpenAI API 需要处理大量的认证、格式化和解析工作。使用 LangChain SDK 可以大幅简化这一过程。

import os
import requests

# API Key
api_key = os.getenv('OPENAI_API_KEY')

# 头部信息
headers = {
    'Content-Type': 'application/json',
    'Authorization': f'Bearer {api_key}'
}

# 准备数据
data = {
    'model': 'gpt-4',
    'messages': [{'role': 'user', 'content': '什么是图计算？'}],
    'temperature': 0.7
}

# 调用 API
url = 'https://api.openai.com/v1/chat/completions'
response = requests.post(url, json=data, headers=headers)
answer = response.json()['choices'][0]['message']['content']
print(answer)

from langchain_openai import ChatOpenAI

# 调用 Chat Completion API
llm = ChatOpenAI(model_name='gpt-4')
response = llm.invoke('什么是图计算？')
print(response)

from langchain_openai import ChatOpenAI

# 调用 Chat Completion API
llm = ChatOpenAI(model_name='gpt-4')
response = llm.invoke('什么是图计算？')
print(response)

from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

# 创建 LLM
llm = ChatOpenAI(model_name='gpt-4')

# 创建 Prompt
prompt = ChatPromptTemplate.from_template("{question}")

# 创建输出解析器
output_parser = StrOutputParser()

# 调用 LLM
message = prompt.invoke({'question': '什么是图计算？'})
response = llm.invoke(message)
answer = output_parser.invoke(response)
print(answer)

from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

# 创建 LLM
llm = ChatOpenAI(model_name='gpt-4')

# 创建 Prompt
prompt = ChatPromptTemplate.from_template("{question}")

# 创建输出解析器
output_parser = StrOutputParser()

# 创建 Chain
chain = prompt | llm | output_parser

# 调用 Chain
answer = chain.invoke({'question': '什么是图计算？'})
print(answer)

from langchain_core.runnables import RunnablePassthrough

# 创建 Chain
chain = {"question": RunnablePassthrough()} | prompt | llm | output_parser

# 调用 Chain
answer = chain.invoke('什么是图计算？')
print(answer)

from operator import itemgetter

from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI

# 创建 LLM
llm = ChatOpenAI(model_name='gpt-4')

# 创建输出解析器
output_parser = StrOutputParser()

# 创建 Prompt
topic_prompt = ChatPromptTemplate.from_template("生成一种'{input}'的名称")
good_prompt = ChatPromptTemplate.from_template("列举{topic}的好处:")
bad_prompt = ChatPromptTemplate.from_template("列举{topic}的坏处:")
summary_prompt = ChatPromptTemplate.from_messages(
    [
        ("ai", "{topic}"),
        ("human", "好处:\n{good}\n\n坏处:\n{bad}"),
        ("system", "生成最终结论"),
    ]
)

# 创建组合 Chain
topic_chain = topic_prompt | llm | output_parser | {"topic": RunnablePassthrough()}
goods_chain = good_prompt | llm | output_parser
bads_chain = bad_prompt | llm | output_parser
summary_chain = summary_prompt | llm | output_parser
chain = (
    topic_chain
    |
    {
        "good": goods_chain,
        "bad": bads_chain,
        "topic": itemgetter("topic"),
    }
    | summary_chain
)

# 调用 chain
answer = chain.invoke({"input": '常见水果'})
print(answer)

from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage
from langgraph.graph import END, MessageGraph

# 初始化聊天模型
model = ChatOpenAI(temperature=0)

# 创建一个 MessageGraph
graph = MessageGraph()

# 添加一个名为 "oracle" 的节点，它执行聊天模型并返回结果
graph.add_node("oracle", model)
graph.add_edge("oracle", END)
graph.set_entry_point("oracle")

# 编译图
runnable = graph.compile()

# 运行图
result = runnable.invoke(HumanMessage("What is 1 + 1?"))
print(result)  # 输出聊天模型的回答

from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.vectorstores.faiss import FAISS
from langchain_core.documents import Document
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import OpenAIEmbeddings, ChatOpenAI

# 创建 LLM
llm = ChatOpenAI(model_name='gpt-4')

# 创建 Prompt
prompt = ChatPromptTemplate.from_template('基于上下文：{context}\n回答：{input}')

# 创建输出解析器
output_parser = StrOutputParser()

# 模拟文档
docs = [Document(page_content="TuGraph 是蚂蚁开源的图数据库产品")]

# 文档嵌入
splits = RecursiveCharacterTextSplitter().split_documents(docs)
vector_store = FAISS.from_documents(splits, OpenAIEmbeddings())
retriever = vector_store.as_retriever()

# 创建 Chain
chain_no_context = RunnablePassthrough() | llm | output_parser
chain = (
    {"context": retriever, "input": RunnablePassthrough()}
    | prompt | llm | output_parser
)

# 调用 Chain
print(chain_no_context.invoke('蚂蚁图数据库开源了吗？'))
print(chain.invoke('蚂蚁图数据库开源了吗？'))

from openai import OpenAI
import json

client = OpenAI()

# Example dummy function hard coded to return the same weather
# In production, this could be your backend API or an external API
def get_current_weather(location, unit="fahrenheit"):
    """Get the current weather in a given location"""
    if "tokyo" in location.lower():
        return json.dumps({"location": "Tokyo", "temperature": "10", "unit": unit})
    elif "san francisco" in location.lower():
        return json.dumps({"location": "San Francisco", "temperature": "72", "unit": unit})
    elif "paris" in location.lower():
        return json.dumps({"location": "Paris", "temperature": "22", "unit": unit})
    else:
        return json.dumps({"location": location, "temperature": "unknown"})

def run_conversation():
    # Step 1: send the conversation and available functions to the model
    messages = [{"role": "user", "content": "What's the weather like in San Francisco, Tokyo, and Paris?"}]
    tools = [
        {
            "type": "function",
            "function": {
                "name": "get_current_weather",
                "description": "Get the current weather in a given location",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "location": {
                            "type": "string",
                            "description": "The city and state, e.g. San Francisco, CA",
                        },
                        "unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
                    },
                    "required": ["location"],
                },
            },
        }
    ]
    response = client.chat.completions.create(
        model="gpt-3.5-turbo-0125",
        messages=messages,
        tools=tools,
        tool_choice="auto",  # auto is default, but we'll be explicit
    )
    response_message = response.choices[0].message
    tool_calls = response_message.tool_calls
    # Step 2: check if the model wanted to call a function
    if tool_calls:
        # Step 3: call the function
        # Note: the JSON response may not always be valid; be sure to handle errors
        available_functions = {
            "get_current_weather": get_current_weather,
        }  # only one function in this example, but you can have multiple
        messages.append(response_message)  # extend conversation with assistant's reply
        # Step 4: send the info for each function call and function response to the model
        for tool_call in tool_calls:
            function_name = tool_call.function.name
            function_to_call = available_functions[function_name]
            function_args = json.loads(tool_call.function.arguments)
            function_response = function_to_call(
                location=function_args.get("location"),
                unit=function_args.get("unit"),
            )
            messages.append(
                {
                    "tool_call_id": tool_call.id,
                    "role": "tool",
                    "name": function_name,
                    "content": function_response,
                }
            )  # extend conversation with function response
        second_response = client.chat.completions.create(
            model="gpt-3.5-turbo-0125",
            messages=messages,
        )  # get a new response from the model where it can see the function response
        return second_response
print(run_conversation())

import random

from langchain_core.output_parsers.openai_tools import JsonOutputToolsParser
from langchain_core.runnables import RunnablePassthrough
from langchain_core.tools import tool
from langchain_openai import ChatOpenAI

# 定义 Tool
@tool
def get_temperature(city: str) -> int:
    """获取指定城市的当前气温"""
    return random.randint(-20, 50)

# 创建 LLM
llm = ChatOpenAI(model_name='gpt-4')

# 创建 JSON 输出解析器
output_parser = JsonOutputToolsParser()

# 创建 Chain
chain = (
    RunnablePassthrough()
    | llm.bind_tools(tools=[get_temperature])
    | output_parser
)

# 调用 Chain
print(chain.invoke('杭州今天多少度？'))

[{'type': 'get_temperature', 'args': {'city': '杭州'}}]

import random

from langchain.agents import create_openai_tools_agent, \
    AgentExecutor
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder, \
    HumanMessagePromptTemplate, SystemMessagePromptTemplate
from langchain_core.tools import tool
from langchain_openai import ChatOpenAI

# 创建 LLM
llm = ChatOpenAI()

# 定义 Tool
@tool
def get_temperature(city: str) -> int:
    """获取指定城市的当前气温"""
    return random.randint(-20, 50)

# 创建 Agent 提示词模板
prompt = ChatPromptTemplate.from_messages([
    SystemMessagePromptTemplate.from_template('You are a helpful assistant'),
    MessagesPlaceholder(variable_name='chat_history', optional=True),
    HumanMessagePromptTemplate.from_template('{input}'),
    MessagesPlaceholder(variable_name='agent_scratchpad')
])

# 创建 Agent
tools = [get_temperature]
agent = create_openai_tools_agent(llm, tools, prompt=prompt)

# 执行 Agent
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
print(agent_executor.invoke({'input': '今天杭州多少度？'})['output'])

LangChain 工程架构深度解析

LangChain 是什么

技术架构

LangChain 库核心组件

使用例子

最原始的 RESTful API vs LangChain SDK

LangChain 工程架构深度解析

LangChain 是什么

技术架构

LangChain 库核心组件

使用例子

最原始的 RESTful API vs LangChain SDK

更多推荐文章

相关免费在线工具

IO 抽象

组装成链

Memory（记忆）

RAG（检索增强）

Tool（插件）

Agent（智能体）

生产环境部署建议

更多推荐文章

相关免费在线工具

LangChain 工程架构深度解析

LangChain 是什么

技术架构

LangChain 库核心组件

使用例子

最原始的 RESTful API vs LangChain SDK

LangChain 工程架构深度解析

LangChain 是什么

技术架构

LangChain 库核心组件

使用例子

最原始的 RESTful API vs LangChain SDK

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

IO 抽象

组装成链

Memory（记忆）

RAG（检索增强）

Tool（插件）

Agent（智能体）

生产环境部署建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具