Python tavily 库：Tavily 搜索 API 交互工具 | 极客日志

PythonAI

Python tavily 库：Tavily 搜索 API 交互工具

Python tavily 库是与 Tavily 搜索 API 交互的 Python 包装器，专为 AI 代理和 LLM 设计。支持同步和异步客户端，提供 Web 搜索、问答、内容提取、网站爬取及站点映射等功能。安装简单，需配置 API 密钥。适用于 RAG 应用、聊天机器人、数据分析及自动化研究。相比传统爬虫，它提供更清洗的数据和更快的响应速度，适合增强 AI 知识库。

moshang发布于 2026/3/27更新于 2026/7/2150 浏览

Python 的 tavily 库（tavily-python）是一个用于与 Tavily 搜索 API 交互的 Python 包装器，旨在为 AI 代理和大型语言模型（LLMs）提供实时、准确的 Web 搜索和内容提取功能。它由 Tavily AI 开发，支持同步和异步客户端，适合集成到 Python 应用程序中以增强搜索、问答和内容爬取能力。

1. 什么是 `tavily` 库？

tavily 库是 Tavily 公司开发的 Python SDK，用于简化与 Tavily 搜索 API 的交互。Tavily API 是一个专为 AI 代理和 LLMs 优化的搜索引擎，提供实时、准确、可验证的搜索结果，特别适合检索增强生成（RAG）等 AI 工作流。tavily 库支持搜索、问答、内容提取、网站爬取和站点映射等功能，易于集成到 Python 项目中。

核心特点：

AI 优化：专为 AI 代理设计，提供简洁、准确的搜索结果。
多功能：支持搜索、问答、内容提取、爬取和站点映射。
同步和异步：提供 TavilyClient 和 AsyncTavilyClient，适应不同场景。
可定制：支持搜索深度、域名过滤、结果数量等参数。
易用性：通过简单的 API 密钥认证，提供直观的 Python 接口。

2. 安装 `tavily` 库

2.1 安装方法

通过 pip 安装 tavily-python：

pip install tavily-python

安装后，可验证版本：

python -c "import tavily; print(tavily.__version__)"

输出示例：0.7.3。

2.2 依赖要求

Python 版本：3.8 或以上。
必需依赖：requests（用于 HTTP 请求），自动安装。
可选依赖：
- aiohttp：异步客户端（AsyncTavilyClient）所需。
- cohere：用于 Tavily Hybrid RAG 的嵌入和排名功能（需单独安装）。
- pydantic：某些集成（如 AutoGen）可能需要，用于数据验证。

2.3 获取 API 密钥

使用 tavily 库需 Tavily API 密钥：

访问 Tavily 官网，注册账户。
在用户仪表板获取 API 密钥（格式如 tvly-YOUR_API_KEY）。

设置环境变量（推荐）：

export TAVILY_API_KEY="tvly-YOUR_API_KEY"

或在代码中直接传递：

 tavily  TavilyClient
client = TavilyClient(api_key=)

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

功能	描述	示例场景
搜索	Web 搜索，返回结构化结果	研究最新新闻、查找资料
问答	直接回答查询，适合 LLM	构建问答机器人
内容提取	从 URL 提取清洗内容	分析网页数据
网站爬取	爬取相关页面内容	收集专题信息
站点映射	返回网站结构	网站分析、导航提取
混合 RAG	结合 Web 和数据库检索	增强 AI 知识库

from tavily import TavilyClient
# 初始化客户端
client = TavilyClient(api_key="tvly-YOUR_API_KEY")
# 执行搜索
response = client.search("Python 3.12 新特性")
print(response)

{"query":"Python 3.12 新特性","results":[{"title":"What's New In Python 3.12","url":"https://docs.python.org/3/whatsnew/3.12.html","content":"Python 3.12 introduces new syntax for type annotations..."}],"response_time":1.67}

answer = client.qna_search(query="谁是 Lionel Messi？")
print(answer)

Lionel Messi 是阿根廷职业足球运动员，广泛认为是足球史上最伟大的球员之一。

urls = ["https://en.wikipedia.org/wiki/Artificial_intelligence", "https://en.wikipedia.org/wiki/Machine_learning"]
response = client.extract(urls, include_images=True)
for result in response["results"]:
    print(f"URL: {result['url']}")
    print(f"内容：{result['raw_content'][:200]}...")

response = client.crawl(
    url="https://wikipedia.org/wiki/Lemon",
    max_depth=3,
    limit=50,
    instructions="仅提取关于柑橘类水果的页面"
)
for result in response["results"]:
    print(f"URL: {result['url']}")
    print(f"片段：{result['raw_content'][:200]}...")

response = client.map(
    url="https://docs.tavily.com",
    max_depth=2,
    instructions="查找 Python SDK 相关页面"
)
for url in response["results"]:
    print(url)

import asyncio
from tavily import AsyncTavilyClient

async def main():
    client = AsyncTavilyClient(api_key="tvly-YOUR_API_KEY")
    response = await client.search("Python 异步编程")
    print(response)

asyncio.run(main())

from langchain_community.retrievers import TavilySearchAPIRetriever
retriever = TavilySearchAPIRetriever(k=3, api_key="tvly-YOUR_API_KEY")
results = retriever.invoke("Python 3.12 新特性")
print(results)

import time
from tavily import TavilyClient

client = TavilyClient(api_key="tvly-YOUR_API_KEY")
start = time.time()
response = client.search("Python 3.12 新特性", search_depth="advanced")
print(f"响应时间：{time.time() - start:.2f} 秒")

import asyncio

async def main():
    client = AsyncTavilyClient(api_key="tvly-YOUR_API_KEY")
    await client.search("测试")

asyncio.run(main())

from tavily import TavilyClient, MissingAPIKeyError, InvalidAPIKeyError

try:
    client = TavilyClient(api_key="")
except MissingAPIKeyError:
    print("缺少 API 密钥")

import os
client = TavilyClient(api_key=os.getenv("TAVILY_API_KEY"))

response = client.search("测试")
if response["failed_results"]:
    print("失败结果:", response["failed_results"])

from tenacity import retry, stop_after_attempt, wait_fixed

@retry(stop=stop_after_attempt(3), wait=wait_fixed(2))
async def safe_search(client, query):
    return await client.search(query)

async def fetch_multiple():
    client = AsyncTavilyClient(api_key="tvly-YOUR_API_KEY")
    tasks = [client.search(q) for q in ["查询 1", "查询 2"]]
    results = await asyncio.gather(*tasks)
    return results

response = client.search("Python 教程", search_depth="advanced", include_domains=["python.org", "realpython.com"])

from dotenv import load_dotenv
import os

load_dotenv()
client = TavilyClient(api_key=os.getenv("TAVILY_API_KEY"))

功能	示例代码	说明
搜索	`client.search("Python 3.12")`	返回结构化 Web 搜索结果
问答	`client.qna_search("谁是 Messi？")`	提供简洁的答案，适合 LLM
内容提取	`client.extract(["url1", "url2"])`	从 URL 提取清洗内容
网站爬取	`client.crawl(url, instructions="...")`	爬取相关页面内容
站点映射	`client.map(url, max_depth=2)`	返回网站结构 URL 列表
异步搜索	`await async_client.search("查询")`	高并发场景的异步调用

Python tavily 库：Tavily 搜索 API 交互工具

1. 什么是 `tavily` 库？

2. 安装 `tavily` 库

2.1 安装方法

2.2 依赖要求

2.3 获取 API 密钥

更多推荐文章

相关免费在线工具

2.4 注意事项

3. 核心功能

4. 使用方法与示例

4.1 基本搜索

4.2 问答搜索

4.3 内容提取

4.4 网站爬取

4.5 站点映射

4.6 异步客户端

4.7 集成 LangChain

5. 性能分析

6. 适用场景

7. 注意事项

8. 最佳实践

9. 总结表

10. 学习资源

11. 总结

更多推荐文章

相关免费在线工具

Python tavily 库：Tavily 搜索 API 交互工具

1. 什么是 tavily 库？

2. 安装 tavily 库

2.1 安装方法

2.2 依赖要求

2.3 获取 API 密钥

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.4 注意事项

3. 核心功能

4. 使用方法与示例

4.1 基本搜索

4.2 问答搜索

4.3 内容提取

4.4 网站爬取

4.5 站点映射

4.6 异步客户端

4.7 集成 LangChain

5. 性能分析

6. 适用场景

7. 注意事项

8. 最佳实践

9. 总结表

10. 学习资源

11. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1. 什么是 `tavily` 库？

2. 安装 `tavily` 库