LangChain 大模型应用开发入门指南 | 极客日志

PythonAI算法

LangChain 大模型应用开发入门指南

LangChain 是构建 LLM 应用的流行框架。 LangChain 的安装配置、核心组件（Prompt、Model、VectorStore、Agent）、LCEL 表达式语言以及 RAG 模式实现。内容涵盖 Python 环境搭建、代码示例、常用大模型服务商对比及智谱 AI 实战案例，旨在帮助开发者快速掌握大模型应用开发技能。

王初壹发布于 2025/2/6更新于 2026/5/3121 浏览

什么是 LangChain

LangChain是一个用于开发由大型语言模型（LLMs）支持的应用程序的框架。它旨在简化构建 LLM 应用的流程，提供了一套丰富的组件和工具，使得开发者能够更容易地集成、编排和管理各种 AI 能力。

从生态角度来看，LangChain 不仅支持 Python 生态，也支持 TypeScript/JavaScript 生态，这意味着开发者可以使用熟悉的 JS 技术栈来开发 AI 应用。目前 LangChain 的版本迭代较快，主流版本为 v0.3+，集成了众多的 LLM 提供商和组件，极大地降低了 AI 开发的门槛。

安装与环境配置

LangChain 目前是 v0.3+ 版本，如果使用了旧版本可能会有内容发生变化。以下以 Python 为例进行环境搭建：

如果你使用 pip 作为安装工具，建议按顺序安装核心库及社区扩展：

# 核心库
pip install langchain-core
pip install langchain
pip install langsmith
pip install -U langgraph
pip install "langserve[all]"
pip install -U langchain-cli

# 社区组件（包含文档加载器等）
pip install langchain_community

# 大模型集成
pip install langchain-openai
pip install -qU langchain-anthropic

核心概念与架构

LCEL (LangChain Expression Language)

LCEL 全称 LangChain Expression Language，是一种创建任意自定义链的方法。它提供了一种声明式的接口，允许开发者通过管道操作符 | 轻松组合不同的组件（如 Prompt、Model、Parser），形成可复用的处理链路。

核心组件概览

LangChain 提供了丰富的组件帮助开发者高效构建 LLM 应用，主要组件包括：

术语	说明
Prompt Template	提示词模板，用于定义输入给模型的格式和内容。
Example selectors	示例选择器，用于从一组示例中选择适当的示例以供参考或生成响应。
Chat models	聊天模型，专门设计用于与用户进行对话和互动的语言模型。
Messages	消息，指用户与模型之间的交流内容。
LLM	大语言模型，指大型预训练语言模型，通常用于生成和理解文本。
Output parsers	输出解释器，用于处理和格式化模型生成的输出，使其更易于使用。
Document loaders	文档加载器，用于将文档内容加载到系统中以便处理和分析。
Text splitters	文本分割器，用于将长文本分割成较小的部分，以便更好地处理和分析。
Embedding models	嵌入模型，将文本转换为向量表示，以便进行相似度计算和检索。
Vector stores	向量存储，保存向量数据的数据库或系统，以支持高效的检索和查询。
Retrievers	检索器，负责从存储中获取相关数据或信息的组件。
Indexing	索引，建立数据结构以支持快速搜索和检索。
Tools	工具，辅助完成特定任务的软件组件或功能。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from langchain_core.prompts import PromptTemplate, ChatPromptTemplate

# 简单提示词模板
prompt_template = PromptTemplate.from_template("Tell me a joke about {topic}")
result = prompt_template.invoke({"topic": "cats"})
print(result)

# 聊天提示词模板
chat_prompt = ChatPromptTemplate([
    ("system", "You are a helpful assistant"),
    ("user", "Tell me a joke about {topic}")
])
messages = chat_prompt.invoke({"topic": "cats"})

from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, SystemMessage

# 初始化聊天模型
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.7)

# 发送消息
messages = [
    SystemMessage(content="Translate the following from English into Italian"),
    HumanMessage(content="hi!")
]
response = llm.invoke(messages)
print(response.content)

from langchain_core.output_parsers import StrOutputParser

parser = StrOutputParser()
chain = llm | parser
result = chain.invoke({"input": "What is LangChain?"})

from langchain_text_splitters import CharacterTextSplitter
from langchain_community.document_loaders import PyPDFLoader

# 加载 PDF
loader = PyPDFLoader("example.pdf")
documents = loader.load()

# 文本分割
text_splitter = CharacterTextSplitter.from_tiktoken_encoder(
    encoding_name="cl100k_base", chunk_size=100, chunk_overlap=0
)
texts = text_splitter.split_documents(documents)

from langchain_openai import OpenAIEmbeddings
from langchain_chroma import Chroma

# 初始化嵌入模型
embeddings = OpenAIEmbeddings()

# 创建向量存储
vector_store = Chroma(
    collection_name="example_collection",
    embedding_function=embeddings,
    persist_directory="./chroma_langchain_db"
)

# 添加文档
vector_store.add_texts([txt_content for doc in texts for txt_content in [doc.page_content]])

# 检索
retriever = vector_store.as_retriever()
docs = retriever.invoke("what did the president say?")

from langchain.agents import AgentExecutor, create_tool_calling_agent
from langchain_core.tools import tool

@tool
def multiply(a: int, b: int) -> int:
    """Multiply two numbers."""
    return a * b

tools = [multiply]
agent = create_tool_calling_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

# 执行
response = agent_executor.invoke({"input": "Calculate 5 * 3"})

OPENAI_API_KEY = your_zhupu_ai_key

import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate

load_dotenv()

key = os.getenv("OPENAI_API_KEY")

model = ChatOpenAI(
    temperature=0.95,
    model="glm-4-flash",
    openai_api_key=key,
    openai_api_base="https://open.bigmodel.cn/api/paas/v4/"
)

# 消息定义
messages = [
    SystemMessage(content="Translate the following from English into Italian"),
    HumanMessage(content="hi!")
]

# 直接调用
response = model.invoke(messages)
print(response.content)

# 使用 Chain 链式调用
parser = StrOutputParser()
chain = model | parser
result = chain.invoke(messages)
print(result)

# 结合提示词模板
system_template = "Translate the following into {language}:"
prompt_template = ChatPromptTemplate.from_messages(
    [("system", system_template), ("user", "{text}")]
)
full_chain = prompt_template | model | parser
final_result = full_chain.invoke({"language": "italian", "text": "hello world"})
print(final_result)

LangChain 大模型应用开发入门指南

什么是 LangChain

安装与环境配置

核心概念与架构

LCEL (LangChain Expression Language)

核心组件概览

更多推荐文章

相关免费在线工具

核心模块实战

1. 提示词模板 (Prompt Templates)

2. 模型调用 (Models)

3. 输出解析 (Output Parsers)

4. 文档加载与处理 (Loaders & Splitters)

5. 向量化与检索 (Embeddings & Vector Stores)

6. 智能体 (Agents)

常用大模型与运行环境

常用大模型服务

运行环境选择

基于智谱 AI 的实战示例

总结

更多推荐文章

相关免费在线工具

LangChain 大模型应用开发入门指南

什么是 LangChain

安装与环境配置

核心概念与架构

LCEL (LangChain Expression Language)

核心组件概览

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

核心模块实战

1. 提示词模板 (Prompt Templates)

2. 模型调用 (Models)

3. 输出解析 (Output Parsers)

4. 文档加载与处理 (Loaders & Splitters)

5. 向量化与检索 (Embeddings & Vector Stores)

6. 智能体 (Agents)

常用大模型与运行环境

常用大模型服务

运行环境选择

基于智谱 AI 的实战示例

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具