大模型开发框架 LangChain 入门与实战

大模型开发框架 LangChain 入门与实战 | 极客日志

pip install -r requirements.txt
python-dotenv==1.0.0
langchain==0.0.137
pinecone-client==2.2.1

# 加载环境变量
from dotenv import load_dotenv, find_dotenv
load_dotenv(find_dotenv())

# 为了查询聊天模型 GPT-3.5-turbo 或 GPT-4，导入聊天消息和 ChatOpenAI 的模式（schema）。
from langchain.schema import (
    AIMessage,
    HumanMessage,
    SystemMessage
)
from langchain.chat_models import ChatOpenAI
chat = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.3)
messages = [
    SystemMessage(content="你是一个专业的数据科学家"),
    HumanMessage(content="写一个 Python 脚本，用模拟数据训练一个神经网络")
]
response = chat(messages)
print(response.content, end='\n')

# 导入提示并定义 PromptTemplate
from langchain import PromptTemplate
template = """
您是一位专业的数据科学家，擅长构建深度学习模型。
用几行话解释{concept}的概念
"""
prompt = PromptTemplate(
    input_variables=["concept"],
    template=template,
)

# 用 PromptTemplate 运行 LLM
llm(prompt.format(concept="autoencoder"))
llm(prompt.format(concept="regularization"))

# 导入 LLMChain 并定义一个链，用语言模型和提示作为参数。
from langchain.chains import LLMChain
chain = LLMChain(llm=llm, prompt=prompt)

# 只指定输入变量来运行链。
print(chain.run("autoencoder"))

# 定义一个第二个提示
second_prompt = PromptTemplate(
    input_variables=["ml_concept"],
    template="把{ml_concept}的概念描述转换成用 500 字向我解释，就像我是一个五岁的孩子一样",
)
chain_two = LLMChain(llm=llm, prompt=second_prompt)

# 用上面的两个链定义一个顺序链：第二个链把第一个链的输出作为输入
from langchain.chains import SimpleSequentialChain
overall_chain = SimpleSequentialChain(chains=[chain, chain_two], verbose=True)

# 只指定第一个链的输入变量来运行链。
explanation = overall_chain.run("autoencoder")
print(explanation)

# 导入分割文本的工具，并把上面给出的解释分成文档块
from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=100,
    chunk_overlap=0,
)
texts = text_splitter.create_documents([explanation])

texts[0].page_content

# 导入并实例化 OpenAI embeddings
from langchain.embeddings import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model_name="ada")

# 用嵌入把第一个文本块变成一个向量
query_result = embeddings.embed_query(texts[0].page_content)
print(query_result)

# 导入并初始化 Pinecone 客户端
import os
import pinecone
from langchain.vectorstores import Pinecone

pinecone.init(
    api_key=os.getenv('PINECONE_API_KEY'),
    environment=os.getenv('PINECONE_ENV')
)

# 上传向量到 Pinecone
index_name = "langchain-quickstart"
search = Pinecone.from_documents(texts, embeddings, index_name=index_name)

# 做一个简单的向量相似度搜索
query = "What is magical about an autoencoder?"
result = search.similarity_search(query)
print(result)

# 导入 Python REPL 工具并实例化 Python 代理
from langchain.agents.agent_toolkits import create_python_agent
from langchain.tools.python.tool import PythonREPLTool
from langchain.python import PythonREPL
from langchain.llms.openai import OpenAI

agent_executor = create_python_agent(
    llm=OpenAI(temperature=0, max_tokens=1000),
    tool=PythonREPLTool(),
    verbose=True
)

# 执行 Python 代理
agent_executor.run("找到二次函数 3 * x ** 2 + 2 * x - 1 的根（零点）。")

框架	优势	劣势	理想用例
LangChain	- 灵活性和扩展性高 - 可扩展性强 - 开源	- 学习曲线较陡 - 用户界面不够友好	- 研究项目 - 高性能应用
LlamaIndex	- 搜索和检索效率高 - 易用性好 - 与 Hugging Face 无缝集成 - 开源	- 功能有限 - 黑箱性质	- 信息检索 - 个性化内容生成
Haystack	- 全面的 NLP 流水线 - 灵活性和定制性 - 开源和社区驱动	- 设置更复杂 - 资源密集型	- 信息提取 - 问题回答 - 情感分析
Hugging Face	- 丰富的模型库 - 用户友好平台 - 协作开发 - 开源	- 功能有限 - 成本	- 模型训练和微调 - 模型评估和比较 - 协作研究

大模型开发框架 LangChain 入门与实战

大模型开发框架 LangChain 入门与实战

前言

LangChain 简介

核心优势

LangChain 工作原理

LangChain 框架详解

更多推荐文章

相关免费在线工具

1. Model（模型）

2. Prompt（提示）

3. Chain（链）

4. Agent（代理）

5. Memory（记忆）

LangChain 应用实战

1. AI 应用开发步骤

2. LangChain 应用实战

2.1 模型（LLM 包装器）

2.2 提示

2.3 链

2.4 嵌入和向量存储

2.5 代理

和其他四个框架的对比

总结

更多推荐文章

相关免费在线工具

大模型开发框架 LangChain 入门与实战

大模型开发框架 LangChain 入门与实战

前言

LangChain 简介

核心优势

LangChain 工作原理

LangChain 框架详解

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1. Model（模型）

2. Prompt（提示）

3. Chain（链）

4. Agent（代理）

5. Memory（记忆）

LangChain 应用实战

1. AI 应用开发步骤

2. LangChain 应用实战

2.1 模型（LLM 包装器）

2.2 提示

2.3 链

2.4 嵌入和向量存储

2.5 代理

和其他四个框架的对比

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具