PythonAI

OpenRouter 实战指南：单 API 接入 500+ 模型

OpenRouter 聚合了 500+ 主流 AI 模型，通过统一接口降低开发门槛。本文详解从注册账号、开启免费模型权限到获取 API 密钥的完整流程。涵盖 OpenAI SDK、原生 HTTP 请求及官方 Beta SDK 三种调用方式，并通过流式响应、多轮对话、代码生成等七个实战案例展示具体用法。同时提供参数调优、工具调用及最佳实践建议，帮助开发者高效利用免费与付费模型资源，快速构建 AI 应用。

蜜桃汽水发布于 2026/4/9更新于 2026/7/2349 浏览

OpenRouter 是什么？

OpenRouter 本质上是一个AI 模型 API 聚合平台。你可以把它理解为一个'万能插座'，只需一个 API 密钥和统一接口，就能调用来自 OpenAI、Anthropic、Google、Mistral 等 50+ 提供商的500+ 主流 AI 模型，其中还包含 50+ 个可免费使用的模型。

它的核心优势在于：

统一接口：无需为不同厂商适配不同的 API 格式
灵活切换：一行代码即可更换模型，方便对比测试效果
成本优化：自动选择最经济的模型方案
自动故障转移：主模型不可用时自动切换备用模型

OpenRouter 控制台界面

准备工作：注册与 API 密钥获取

1. 注册账号

访问官网 https://openrouter.ai
点击"Sign Up"注册，支持 Google 账号快速登录或邮箱注册
完成邮箱验证后登录

2. 启用免费模型（重要）

很多开发者容易忽略这一步，导致无法使用免费资源。免费模型需要特殊的隐私设置：

点击右上角头像 → Settings（设置）→ Privacy（隐私）
勾选"Agree to the free models data policy"（同意免费模型数据政策）
保存设置

3. 创建 API 密钥

点击右上角头像 → API Keys（密钥）
点击"Create Key"创建新密钥
输入密钥名称，可选设置额度限制
复制密钥并妥善保存（仅显示一次，丢失需重新生成）

三种核心调用方式（Python）

方式 1：使用 OpenAI SDK（推荐，兼容性最好）

OpenRouter 提供 OpenAI 兼容接口，这意味着我们可以直接复用现有的 OpenAI SDK 代码库，迁移成本极低。

首先安装依赖：

pip install openai python-dotenv

基础案例：调用 GPT-3.5-turbo

import os
from openai import OpenAI
from dotenv import load_dotenv

# 加载环境变量
load_dotenv()

# 配置 OpenRouter 客户端
client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key=os.getenv(),
    default_headers={
        : , 
        :  
    }
)

  ():
    
    completion =  client.chat.completions.create(
        model=,
        messages=[{:,:}]
    )
    
    (completion.choices[].message.content)


 asyncio
asyncio.run(main())

import requests
import os
import json
from dotenv import load_dotenv

load_dotenv()

url = "https://openrouter.ai/api/v1/chat/completions"
headers = {
    "Authorization": f"Bearer {os.getenv('OPENROUTER_API_KEY')}",
    "Content-Type": "application/json",
    "HTTP-Referer": "https://your-website.com", # 可选
    "X-Title": "Your App Name" # 可选
}
data = {
    "model": "deepseek/deepseek-r1-distill-llama-70b:free", # 免费模型
    "messages": [{"role":"user","content":"推荐 3 本 Python 入门书籍"}]
}

# 发送 POST 请求
response = requests.post(url, headers=headers, data=json.dumps(data))
result = response.json()

# 输出结果
print(result["choices"][0]["message"]["content"])

pip install openrouter

from openrouter import OpenRouter
import os
from dotenv import load_dotenv

load_dotenv()

# 初始化客户端
client = OpenRouter(
    api_key=os.getenv("OPENROUTER_API_KEY"),
    base_url="https://openrouter.ai/api/v1"
)

async def main():
    # 发送请求
    response = await client.chat.completions.create(
        model="mistralai/mistral-7b-instruct:free", # 免费模型
        messages=[{"role":"user","content":"什么是大语言模型？"}]
    )
    # 输出结果
    print(response.choices[0].message.content)

# 运行
import asyncio
asyncio.run(main())

async def free_model_demo():
    completion = await client.chat.completions.create(
        model="mistralai/mistral-7b-instruct:free", # 选择免费模型
        messages=[{"role":"user","content":"写一首关于程序员的短诗"}]
    )
    print("免费模型结果：")
    print(completion.choices[0].message.content)

asyncio.run(free_model_demo())

async def streaming_demo():
    print("AI 正在思考，将实时显示结果：")
    stream = await client.chat.completions.create(
        model="openai/gpt-3.5-turbo",
        messages=[{"role":"user","content":"解释什么是流式响应？"}],
        stream=True # 启用流式
    )
    async for chunk in stream:
        if chunk.choices[0].delta.content:
            print(chunk.choices[0].delta.content, end="", flush=True)

asyncio.run(streaming_demo())

async def multi_turn_demo():
    # 初始化对话历史
    messages = [
        {"role":"system","content":"你是一个友好的助手，擅长解释技术概念"},
        {"role":"user","content":"什么是 OpenRouter？"}
    ]
    
    # 第一轮对话
    response = await client.chat.completions.create(
        model="anthropic/claude-3-haiku",
        messages=messages
    )
    assistant_msg = response.choices[0].message
    print("AI:", assistant_msg.content)
    
    # 添加 AI 回复到对话历史
    messages.append(assistant_msg)
    
    # 第二轮对话（基于上下文）
    messages.append({"role":"user","content":"它和直接调用 OpenAI API 有什么区别？"})
    response2 = await client.chat.completions.create(
        model="anthropic/claude-3-haiku",
        messages=messages
    )
    print("AI:", response2.choices[0].message.content)

asyncio.run(multi_turn_demo())

async def code_generation_demo():
    prompt = """
    写一个 Python 函数，实现以下功能：
    1. 接收一个列表作为输入
    2. 计算列表中所有偶数的平方和
    3. 返回结果
    4. 添加详细注释
    """
    response = await client.chat.completions.create(
        model="deepseek/deepseek-coder-6.7b-instruct:free", # 免费代码模型
        messages=[{"role":"user","content": prompt}],
        temperature=0.3 # 降低随机性，提高代码准确性
    )
    print("生成的代码：")
    print(response.choices[0].message.content)

asyncio.run(code_generation_demo())

async def model_comparison_demo():
    prompt = "解释量子计算的基本原理，用简单易懂的语言"
    models = ["openai/gpt-3.5-turbo", "anthropic/claude-3-haiku", "mistralai/mistral-7b-instruct:free"]
    
    for model in models:
        print(f"\n===== {model} =====")
        response = await client.chat.completions.create(
            model=model,
            messages=[{"role":"user","content": prompt}]
        )
        print(response.choices[0].message.content[:200] + "...") # 显示前 200 字符

asyncio.run(model_comparison_demo())

async def parameter_tuning_demo():
    messages = [{"role":"user","content":"写一个关于太空探索的故事"}]
    
    # 高随机性（创意故事）
    print("=== 高随机性（temperature=0.9）===")
    response1 = await client.chat.completions.create(
        model="openai/gpt-3.5-turbo",
        messages=messages,
        temperature=0.9, # 0-2，越高越随机
        max_tokens=200 # 限制最大长度
    )
    print(response1.choices[0].message.content)
    
    # 低随机性（结构化输出）
    print("\n=== 低随机性（temperature=0.1）===")
    response2 = await client.chat.completions.create(
        model="openai/gpt-3.5-turbo",
        messages=messages,
        temperature=0.1,
        max_tokens=200,
        top_p=0.1 # 核采样，0-1，越小越集中
    )
    print(response2.choices[0].message.content)

asyncio.run(parameter_tuning_demo())

async def tool_calling_demo():
    # 定义可用工具
    tools = [{
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "获取指定城市的天气信息",
            "parameters": {
                "type": "object",
                "properties": {
                    "city": {"type": "string", "description": "城市名称"}
                },
                "required": ["city"]
            }
        }
    }]
    
    response = await client.chat.completions.create(
        model="openai/gpt-3.5-turbo",
        messages=[{"role":"user","content":"北京今天的天气怎么样？"}],
        tools=tools,
        tool_choice="auto" # 自动选择工具
    )
    
    # 处理工具调用请求
    tool_calls = response.choices[0].message.tool_calls
    if tool_calls:
        print("需要调用工具：", tool_calls[0].function.name)
        # 这里可以添加调用外部天气 API 的逻辑
        # 然后将结果返回给模型继续生成回复

asyncio.run(tool_calling_demo())

OpenRouter 实战指南：单 API 接入 500+ 模型

OpenRouter 是什么？

准备工作：注册与 API 密钥获取

1. 注册账号

2. 启用免费模型（重要）

3. 创建 API 密钥

三种核心调用方式（Python）

方式 1：使用 OpenAI SDK（推荐，兼容性最好）

OpenRouter 实战指南：单 API 接入 500+ 模型

OpenRouter 是什么？

准备工作：注册与 API 密钥获取

1. 注册账号

2. 启用免费模型（重要）

3. 创建 API 密钥

三种核心调用方式（Python）

方式 1：使用 OpenAI SDK（推荐，兼容性最好）

更多推荐文章

相关免费在线工具

方式 2：直接 API 调用（无依赖，适合轻量场景）

方式 3：使用 OpenRouter Python SDK（Beta 版）

7 个实战案例，覆盖主流应用场景

案例 1：免费模型调用（零成本学习）

案例 2：流式响应（实时显示结果）

案例 3：多轮对话（上下文记忆）

案例 4：代码生成与解释

案例 5：模型对比测试（一行代码切换模型）

案例 6：参数调优（控制输出风格）

案例 7：工具调用（连接外部 API）

常见问题与最佳实践

常见问题

最佳实践

进阶方向

总结

更多推荐文章

相关免费在线工具

OpenRouter 实战指南：单 API 接入 500+ 模型

OpenRouter 是什么？

准备工作：注册与 API 密钥获取

1. 注册账号

2. 启用免费模型（重要）

3. 创建 API 密钥

三种核心调用方式（Python）

方式 1：使用 OpenAI SDK（推荐，兼容性最好）

OpenRouter 实战指南：单 API 接入 500+ 模型

OpenRouter 是什么？

准备工作：注册与 API 密钥获取

1. 注册账号

2. 启用免费模型（重要）

3. 创建 API 密钥

三种核心调用方式（Python）

方式 1：使用 OpenAI SDK（推荐，兼容性最好）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

方式 2：直接 API 调用（无依赖，适合轻量场景）

方式 3：使用 OpenRouter Python SDK（Beta 版）

7 个实战案例，覆盖主流应用场景

案例 1：免费模型调用（零成本学习）

案例 2：流式响应（实时显示结果）

案例 3：多轮对话（上下文记忆）

案例 4：代码生成与解释

案例 5：模型对比测试（一行代码切换模型）

案例 6：参数调优（控制输出风格）

案例 7：工具调用（连接外部 API）

常见问题与最佳实践

常见问题

最佳实践

进阶方向

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具