免费 AI 大模型 API 汇总及国内大模型使用教程

免费 AI 大模型 API 汇总及国内大模型使用教程 | 极客日志

免费 AI 大模型 API 汇总及国内大模型使用教程

随着人工智能技术的快速发展，各大厂商纷纷开放了部分免费的大模型 API 接口，为开发者提供了低成本接入大模型能力的机会。本文整理了讯飞星火、百度千帆、腾讯混元、扣子（Coze）以及硅基流动等主流平台的免费资源，并提供详细的 Python 调用示例。

免费大模型 API 一览

下表列出了各平台提供的免费模型版本及其主要限制条件：

大模型	免费版本	免费限制	控制台（api_key 等）	API 文档
讯飞星火大模型	spark-lite	tokens：总量无限；QPS：2；有效期：不限	需注册账号获取	API 文档
百度千帆大模型平台	ERNIE-Speed-8K	RPM = 300，TPM = 300000	需实名认证并创建应用	千帆文档
	ERNIE-Speed-128K	RPM = 60，TPM = 300000
	ERNIE-Lite-8K-0922	RPM = 300，TPM = 300000
	ERNIE-Lite-8K	RPM = 300，TPM = 300000
	ERNIE-Tiny-8K	RPM = 300，TPM = 300000
腾讯混元大模型	hunyuan-lite	限制并发数为 5 路	需创建密钥	混元文档
字节扣子 (coze.cn)	豆包·Function call 模型 (32K)	QPS: 2, QPM: 60, QPD: 3000	需发布 Bot 为 API 服务	扣子文档
Llama Family	Atom-13B-Chat	每天 8-22 点：限速 20 次/分；22-次日 8 点：限速 50 次/分	需申请或注册	-
groq	llama3-8b-8192	rpm 为 30, rpd 为 14400	需注册获取 Key	Groq 文档
Google Gemini	gemini-1.5-pro	15RPM; 100 万 TPM; 1500 RPD	需 Google 账号	Gemini 文档
硅基流动	Qwen2-7B-Instruct	RPM 限制为 100，QPS 限制为 3	需创建 API 密钥	硅基文档

讯飞星火 spark-lite 模型接入

1. 准备工作

访问讯飞星火认知大模型官网，注册账号并完成实名认证。在控制台中创建应用，获取 APPID、APISecret 和 APIKey。

2. 请求地址与参数

Spark Lite 模型使用 WebSocket 协议进行通信。核心参数如下：

请求地址：wss://spark-api.xf-yun.com/v1.1/chat
Domain 参数：general

3. Python 代码示例

由于星火使用的是 WebSocket，以下展示基于 websocket-client 库的简化逻辑框架（实际开发中需处理鉴权签名生成）：

import websocket
import json
import time

def on_message(ws, message):
    data = json.loads(message)
    content = data.get('payload', {}).get('choices', {}).get('text', [])
    if content:
        print(content[0]['content'])

def on_error(ws, error):
    print(f"Error: {error}")

def on_close(ws, close_status_code, close_msg):
    print("Connection closed")

def on_open(ws):
    # 此处应包含鉴权签名的生成逻辑
    # 参考官方文档中的 auth.py 文件
    request_data = {
        "header": {"app_id": "你的 APPID", "uid": "1234"},
        "parameter": {
            "chat": {
                "domain": "general",
                "temperature": 0.5,
                "max_tokens": 2048
            }
        },
        "payload": {
            "message": {
                "text": [{"role": "user", "content": "你好"}]
            }
        }
    }
    ws.send(json.dumps(request_data))

 __name__ == :
    
    url = 
    ws = websocket.WebSocketApp(url, on_open=on_open, on_message=on_message, on_error=on_error, on_close=on_close)
    ws.run_forever()

百度千帆 speed 和 lite 模型接入

1. 开通流程

登录百度智能云千帆平台。
完成实名认证。
在'应用接入'中创建应用，获取 AppID、API Key、Secret Key。

2. 模型参数映射

不同模型对应的 model 参数如下：

模型名称	参数值
ERNIE-Speed-128K	ernie-speed-128k
ERNIE-Speed-8K	ernie-speed
ERNIE-Lite-8K-0922	eb-instant
ERNIE-Lite-8K	ernie-lite-8k
ERNIE-Tiny-8K	ernie-tiny-8k

3. Python 代码示例

百度千帆采用 OAuth 2.0 获取 Access Token，随后通过 HTTP POST 发送请求。

import requests
import json

API_KEY = "你的 API Key"
SECRET_KEY = "你的 Secret Key"

def get_access_token():
    """
    使用 AK，SK 生成鉴权签名（Access Token）
    :return: access_token，或是 None(如果错误)
    """
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {
        "grant_type": "client_credentials",
        "client_id": API_KEY,
        "client_secret": SECRET_KEY
    }
    response = requests.post(url, params=params)
    result = response.json()
    return result.get("access_token")

def main():
    access_token = get_access_token()
    if not access_token:
        print("Failed to get access token")
        return

    url = f"https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/ernie_speed?access_token={access_token}"
    
    payload = json.dumps({
        "messages": [
            {
                "role": "user",
                "content": "请介绍大模型的基本原理"
            }
        ]
    })
    headers = {
        'Content-Type': 'application/json'
    }
    
    try:
        response = requests.request("POST", url, headers=headers, data=payload)
        print(response.text)
    except Exception as e:
        print(f"Request failed: {e}")

if __name__ == '__main__':
    main()

腾讯混元 hunyuan-lite 模型接入

1. 密钥管理

登录腾讯云控制台，进入'混元大模型'页面。点击'创建密钥'，生成新的 API 密钥。建议将密钥存储在环境变量中，避免硬编码在代码里。

2. 调试与集成

腾讯云提供在线调试界面，可先在此测试 Prompt 效果。确认无误后，将调试成功的请求结构复制到本地代码中。通常需要使用 tencentcloud-sdk-python 或标准 HTTP 库进行封装。

扣子 (Coze) API 使用

1. 前置条件

已创建个人访问令牌（Personal Access Token）。
已将 Bot 发布为 API 服务。

2. 步骤详解

创建令牌：在 Coze 平台个人中心创建令牌，并配置对应权限。
发布 Bot：进入目标空间，选择 Bot，点击发布，选择 Bot as API 选项。

3. Python 代码示例

单轮对话请求示例：

import requests

url = "https://api.coze.cn/open_api/v2/chat"
headers = {
    "Authorization": "Bearer YOUR_PERSONAL_ACCESS_TOKEN",
    "Content-Type": "application/json",
    "Accept": "*/*",
    "Host": "api.coze.cn"
}
data = {
    "conversation_id": "123",
    "bot_id": "YOUR_BOT_ID",
    "user": "29032201862555",
    "query": "你好",
    "stream": False
}

response = requests.post(url, headers=headers, json=data)
print(f"Status Code: {response.status_code}")
print(f"Response: {response.json()}")

硅基流动 SiliconFlow 接入

1. 平台资源

硅基流动提供了多个开源模型的免费额度，包括 Qwen、GLM、Yi 等系列。进入控制台创建新 API 密钥即可开始使用。

2. 支持模型列表

Qwen/Qwen2-7B-Instruct (32K, 免费)
THUDM/glm-4-9b-chat (32K, 免费)
01-ai/Yi-1.5-9B-Chat-16K (16K, 免费)

3. Python 代码示例

硅基流动兼容 OpenAI 格式接口，便于迁移：

import requests

url = "https://api.siliconflow.cn/v1/chat/completions"

payload = {
    "model": "Qwen/Qwen2-7B-Instruct",
    "messages": [
        {
            "role": "user",
            "content": "你好"
        }
    ],
    "max_tokens": 4096,
    "stream": False,
    "temperature": 0.5
}

headers = {
    "accept": "application/json",
    "content-type": "application/json",
    "authorization": "Bearer YOUR_API_KEY"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)

安全与最佳实践

密钥管理：切勿将 API Key 直接提交到 Git 仓库。建议使用 .env 文件或操作系统环境变量存储敏感信息。
异常处理：网络请求可能超时或返回错误码（如 401 未授权、429 限流）。代码中应增加重试机制和日志记录。
成本控制：即使是免费额度，也需注意 Token 消耗。在生产环境中，建议对输入输出内容进行缓存或截断处理。
合规性：确保生成的内容符合法律法规要求，避免涉及敏感话题。

通过以上步骤，开发者可以快速集成各大主流大模型能力，构建智能问答、内容生成或数据分析等应用场景。

免费 AI 大模型 API 汇总及国内大模型使用教程