LangChain 与智能 Agent：AI 助手构建实战

LangChain 与智能 Agent：AI 助手构建实战 | 极客日志

智能代理类型	预期模型类型	支持聊天历史	支持多输入工具	支持并行函数调用	需要的模型参数	何时使用
OpenAI Tools	聊天型	✅	✅	✅	tools	如果你使用的是较新的 OpenAI 模型（1106 及以后）
OpenAI Functions	聊天型	✅	✅		functions	如果你使用的是 OpenAI 模型，或者是经过微调以支持函数调用的开源模型，并且暴露与 OpenAI 相同的函数参数
XML	大型语言模型	✅				如果你使用的是 Anthropic 模型，或者其他擅长 XML 的模型
Structured Chat	聊天型	✅	✅			如果你需要支持具有多个输入的工具
JSON Chat	聊天型	✅				如果你使用的是擅长 JSON 的模型
ReAct	大型语言模型	✅				如果你使用的是简单模型，推理观察再行动
Self Ask With Search	大型语言模型					如果你使用的是简单模型，并且只有一个搜索工具，追问 + 中间答案的技巧，who/when/how

from face_functions import (
    extract_compare_scores,
    extract_local_group_size,
    extract_actual_group_size,
    perform_logic_judgement,
    search_by_exact_query,
    search_by_fuzzy_query,
    blacklist
)

# 定义 zmng_query 工具的具体实现函数
def zmng_query(uid):
    # 实现查询 zmng 平台以获取与 uid 相关的错误详情
    # 查询可能包括黑名单状态、比对分数和 groupSize
    # 返回查询结果
    return "需要调用 compare_scores_tool extract_local_group_size extract_actual_group_size blacklist_query perform_logic_judgement 这五个 tool，用于问题的排查输入"

# 创建 zmng_query 工具实例
zmng_query_tool = Tool(
    name="zmng_query",
    func=zmng_query,
    description=(
        "当用户刷脸比对不通过，需要确认是否为黑名单或其他原因时使用此工具。"
        "此工具能查询黑名单状态，提取比对分数，并获取机具端及实际的 groupSize 信息，"
        "以便于准确诊断比对失败的原因。需要通过 uid 或 zid 进行查询，"
        "这是一个 9 位数编码，能唯一识别一个人。使用此工具时，至少提供一个参数 ['uid'] 或 ['zid']。"
    )
)

compare_scores_tool = Tool(
    name="extract_compare_scores",
    func=extract_compare_scores,
    description=(
        "当用户刷脸比对不通过时，用于提取日志中的比对分数。"
    )
)

local_group_size_tool = Tool(
    name="extract_local_group_size",
    func=extract_local_group_size,
    description=(
        "当用户刷脸比对不通过时，用于提取日志中机具端的人脸库大小 groupSize。"
    )
)

actual_group_size_tool = Tool(
    name="extract_actual_group_size",
    func=extract_actual_group_size,
    description=(
        "当用户刷脸比对不通过时，用于提取实际的人脸库大小 groupSize。"
    )
)

blacklist_query_tool = Tool(
    name="blacklist_query",
    func=blacklist,
    description="查询指定 UID 是否在黑名单中。"
)

logic_judgement_tool = Tool(
    name="perform_logic_judgement",
    func=perform_logic_judgement,
    description="根据比对分数和本地与实际库的大小，给出比对不通过的分析结论。"
)

tools = [
    compare_scores_tool,      # "当用户刷脸比对不通过时，用于提取日志中的比对分数。"
    local_group_size_tool,    # "当用户刷脸比对不通过时，用于提取日志中机具端的人脸库大小 groupSize。"
    actual_group_size_tool,   # "当用户刷脸比对不通过时，用于提取实际的人脸库大小 groupSize。"
    blacklist_query_tool,     # "查询指定 UID 是否在黑名单中。"
    zmng_query_tool          
]

# LLM 实例化
llm = OpenAI(temperature=0)
# 聊天模型实例化
chat_model = ChatOpenAI(model="gpt-4", temperature=0)

# 代理初始化，结合工具和聊天模型
agent = initialize_agent(tools, chat_model, agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION, verbose=True)


print("您好，有什么能帮助您？(输入 'exit' 结束对话)")
while True:
    user_input = input("You: ")

    if user_input.lower() in ["exit", "goodbye", "quit"]:
        print("再见！")
        break

    # 运行代理并获取当前用户输入的响应
    response = agent.run(user_input)

    # 打印出代理的响应
    print("Agent:", response)

# AgentExecutor 的核心逻辑，伪代码：
next_action = agent.get_action(...)
while next_action != AgentFinish:
  observation = run(next_action)
  next_action = agent.get_action(..., next_action, observation)
return next_action

# 实际 AgentExecutor 中的部分相关代码：
for agent_action in actions:
    if run_manager:
        run_manager.on_agent_action(agent_action, color="green")
    # Otherwise we lookup the tool
    if agent_action.tool in name_to_tool_map:
        tool = name_to_tool_map[agent_action.tool]
        return_direct = tool.return_direct
        color = color_mapping[agent_action.tool]
        tool_run_kwargs = self.agent.tool_run_logging_kwargs()
        if return_direct:
            tool_run_kwargs["llm_prefix"] = ""
        # We then call the tool on the tool input to get an observation
        observation = tool.run(
            agent_action.tool_input,
            verbose=self.verbose,
            color=color,
            callbacks=run_manager.get_child() if run_manager else None,
            **tool_run_kwargs,
        )

def load_qa_data(filepath):
    qa_data = {}
    with open(filepath, 'r', encoding='utf-8') as file:
        lines = file.readlines()
    current_question = None
    answer_lines = []  # 用于累积多行答案的列表
    for line in lines:
        if line.startswith('问题: '):
            if current_question:
                # 将之前问题的答案存储到字典中
                qa_data[current_question] = ' '.join(answer_lines).strip()
            # 去除"问题："部分，并去除两端空白字符
            current_question = line[len('问题: '):].strip()
            answer_lines = []  # 为新的问题重置答案行列表
        elif current_question:
            # 这是一个答案的一部分，可能不是第一行
            answer_lines.append(line.strip())

    # 不要忘记处理文件中的最后一个问题
    if current_question and answer_lines:
        qa_data[current_question] = ' '.join(answer_lines).strip()

    return qa_data

embeddings_model = OpenAIEmbeddings()

# 创建 FAISS 索引
def create_faiss_index(embedding_matrix):
    dimension = embedding_matrix.shape[1]  # 获取向量的维度
    index = faiss.IndexFlatL2(dimension)  # 创建基于 L2 距离的 FAISS 索引
    index.add(embedding_matrix.astype(np.float32))  # 向索引中添加向量
    return index

def search_faiss_index(query_embedding, index):
    query_embedding = np.array(query_embedding).astype(np.float32)  # 确保查询向量为 float32 类型
    _, indices = index.search(np.array([query_embedding]), 1)  # 在索引中搜索最相似的向量
    return indices[0][0]  # 返回最相似向量的索引

def search_by_exact_query(user_query):
    # 从文件加载问题和答案
    qa_data = load_qa_data(filepath)

    # 获取答案并打印
    return(get_answer(qa_data, user_query))

def search_by_fuzzy_query(user_query):
    # 从文件加载问题和答案
    qa_data = load_qa_data(filepath)
    # Get embedding vectors for all questions and convert to numpy array
    questions = list(qa_data.keys())
    question_embeddings_list = embeddings_model.embed_documents(questions)
    question_embeddings = np.array(question_embeddings_list)

    # Create the faiss index
    faiss_index = create_faiss_index(question_embeddings)

    # # Prompt user for a query and process
    user_query_embedding_list = embeddings_model.embed_documents([user_query])
    user_query_embedding = np.array(user_query_embedding_list[0])

    # Search the faiss index for the most similar question
    closest_question_index = search_faiss_index(user_query_embedding, faiss_index)
    closest_question = questions[closest_question_index]

    # Print the closest question's answer
    return(qa_data[closest_question])

tools = [
    Tool(
        name="search_by_exact",
        func=search_by_exact_query,
        description="当需要准确回答用户问题时使用此工具。使用时需提供参数 ['query']。如果查询为错误代码，直接查询并返回对应的错误原因和解决方法；如果观察结果显示有必要或可选发送邮件，请调用 send_email 工具。"
    ),
    Tool(
        name="search_by_fuzzy",
        func=search_by_fuzzy_query,
        description="当需要回答用户问题时使用此工具。使用时需提供参数 ['query']。如果查询为错误代码，直接查询并返回对应的错误原因和解决方法；如果查询非错误代码，可咨询此工具相关解决方案；如果观察结果显示有必要或可选发送邮件，请调用 send_email 工具。"
    ),
    send_email_tool,  # Assuming definition is provided elsewhere
    compare_scores_tool,
    local_group_size_tool,
    actual_group_size_tool,
    blacklist_query_tool,
    zmng_query_tool
]

LangChain 与智能 Agent：AI 助手构建实战

LangChain 概念和结构

LangChain 是什么？

为什么需要 LangChain？

LangChain 主要概念

Models（模型）

LLMs（大型语言模型）

Chat Models（聊天模型）

Text Embedding Models（文本嵌入模型）

Prompts（提示）

Prompt Templates（提示模板）

Indexes（索引）

Document Loaders（文档加载器）

Text Splitters（文本分割器）

Vector Stores（向量存储）

Retrievers（检索器）

Memory（记忆）：对话的连贯性

Chat Message History（聊天消息历史）

Chains（链）

Chain、LLM Chain、Index-related Chains

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

Agents（代理）

Agent 执行过程：AgentExecutor

观察（Observation）

思考（Thought）

行动（Action）

Agent 推理方式：AgentType

Agent 与 Chain 的关系

LangChain 实际案例：人脸技术问题的智能排查助手

使用 LangChain 处理人脸识别问题的排查

zmng_query 工具

extract_compare_scores 工具

extract_local_group_size 和 extract_actual_group_size 工具

blacklist_query 工具

perform_logic_judgement 工具

聊天模型实例化

用户交互

智能代理运行过程

完整的技术链路示例

利用 LangChain 与人脸问答知识库进行交互

模块 1: 问题与答案数据的加载

模块 2: 嵌入向量的生成和 Faiss 索引创建

OpenAIEmbeddings() 初始化

创建 FAISS 索引

在 FAISS 索引中搜索

模块 3: 精确匹配查询

模块 4: 模糊匹配查询

search_by_exact 和 search_by_fuzzy 工具

智能体的快速发展

智能体的基本概念

智能体是什么？

智能体的发展方向

智能体的分类

各种智能体在快速发展

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具