调用大模型 API 开发智能客服,听起来复杂,但用标准化接口其实并不难。我从注册账号到本地部署一个带 RAG 的电商客服机器人,全程在 Windows 上搞定,下面记录一下。
平台能做什么
这个平台相当于一个模型超市,把各种大模型封装成统一的 API,不用去国外官网挨个注册,也不用管网络问题。按量计费,先试用再付费,对个人开发者很友好。它主要优势:
- 一个 API Key 就能调用多个模型,省事;
- 支持文本、图像、视频等多模态,国内外的模型都有;
- 接口兼容原厂参数,不用重新学;稳定性有 SLA 保障;
- 控制台提供用量统计、账单、RAG 知识库管理,适合小团队运营。
接入步骤
注册与开通模型
访问控制台,用手机号注册登录。新用户登录后一般会收到体验金,可以直接抵扣。在控制台里,你可以选'先用后付'或买优惠量包。去模型广场挑需要的模型,比如 GPT-5,按流程支付开通后,在'开通管理'里能看到状态变为'运行中'就可以调用了。
创建 API Key
这是调用凭证,得保管好。进入「API Key」→「新增 API Key」,选择类型:
- 标准模式:只调用基础模型 API;
- 融合模式:可以绑定知识库,调用时自动检索上下文。
我们先用标准模式练手。填个名称(比如'GPT-5 客服项目 Key'),保存后得到一串 key。千万别硬编码在代码里,建议用环境变量,也别提交到 Git。
安全建议
- 测试环境和生产环境分开创建 Key;
- 用环境变量加载,别直接写进代码;
- 不在邮件或 IM 里传递 Key;
- 通过控制台的'调用统计'监控用量,发现异常立刻停用。
第一次调用:文本对话
环境准备:Python 3.7+,安装 requests 和 python-dotenv。
在项目里创建 .env 文件:
AIONLY_API_KEY=你的key
AIONLY_CHAT_URL=https://api.example.com/v1/chat/completions
调用代码:
import os
import requests
from dotenv import load_dotenv
load_dotenv()
API_KEY = os.getenv("AIONLY_API_KEY")
API_URL = os.getenv("AIONLY_CHAT_URL")
HEADERS = {
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
}
def build_chat_payload(user_message, system_prompt="你是专业的 AI 助手,回答简洁准确"):
return {
"model": ,
: [
{: , : system_prompt},
{: , : user_message}
],
: ,
:
}
():
payload = build_chat_payload(user_message)
:
response = requests.post(API_URL, headers=HEADERS, json=payload)
response.raise_for_status()
result = response.json()
reply = result[][][][]
token_usage = result[]
{
: ,
: reply,
: token_usage[],
: token_usage[],
: token_usage[]
}
requests.exceptions.RequestException e:
error_msg = (e)
():
error_msg +=
{: , : error_msg}
__name__ == :
user_input =
result = call_aionly_chat(user_input)
result[]:
(, result[])
()
:
(, result[])


