One API 统一调用 ChatGLM/文心一言等 20+ 大模型 | 极客日志

PythonSaaSAI

One API 统一调用 ChatGLM/文心一言等 20+ 大模型

介绍如何使用 One API 统一调用 ChatGLM、文心一言等 20+ 大模型。通过 Docker 快速部署网关，配置智谱、百度等渠道密钥，将异构接口转换为标准 OpenAI RESTful 协议。支持 Python SDK、curl 及 Postman 零改造调用，提供令牌管理、权限隔离、流式响应及故障自动重试等企业级能力，解决多模型接入碎片化问题。

竹影清风发布于 2026/4/6更新于 2026/7/2256 浏览

One API 统一调用 ChatGLM/文心一言等 20+ 大模型

你是否经历过这样的困扰：

为调用 ChatGLM 要配一套请求逻辑，换到文心一言又要重写密钥格式和接口地址；
同时对接通义千问、讯飞星火、腾讯混元，每个平台的鉴权方式、参数命名、错误码都不一样；
想给团队共享模型能力，却得为每人分发不同厂商的 API Key，还无法统一管控用量和权限；
客户临时要求切换模型——改代码、测兼容、上线验证，半天时间就没了。

别再被碎片化的大模型接入拖慢节奏了。今天介绍的这个工具，只改一行 URL、换一个 Key，就能让现有 OpenAI 兼容代码无缝跑通 20+ 国产与国际主流大模型——它就是 One API。

这不是一个需要深度定制的中间件，而是一个开箱即用的'大模型协议翻译器'：把所有异构模型的调用，统一收束成标准 OpenAI RESTful 接口。你不用关心背后是百度的 ERNIE Bot、阿里的 Qwen，还是智谱的 GLM-4，只要会调 ChatGPT，你就已经会用它。

本文将带你从零完成部署、配置、调用全流程，不讲抽象架构，只说你能立刻上手的操作细节。全程无需改业务代码，不依赖特定编程语言，工程师可直接集成进 CI/CD。

1. 为什么你需要 One API：统一接口不是噱头，而是真实痛点

在实际工程中，'支持多模型'常被当作功能亮点宣传，但落地时往往变成维护噩梦。我们拆解三个最典型的现实卡点：

1.1 接口协议五花八门，适配成本远超预期

厂商	请求 URL 示例	鉴权方式	消息体字段	流式响应标识
OpenAI	`https://api.openai.com/v1/chat/completions`	`Bearer sk-xxx`	`messages`, `model`, `temperature`	`stream: true` + SSE
百度文心一言	`https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro`	`access_token=xxx`（需先换 token）	`messages`, `model`, `temperature` → 实际为 `temperature` 和 `top_p`	`stream: true` + JSON Lines
阿里通义千问	`https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation`	`Authorization: Bearer your-dashscope-key`	`input.messages`, `model`, `parameters.temperature`	`stream: true` + 自定义分隔符

你会发现：

即使字段名相同（如 model），可选值范围完全不同（gpt-4-turbo vs qwen-max）；
流式返回解析逻辑必须为每个平台单独实现；
错误码体系毫无关联（401 invalid_apikey vs 50001 access_token expired）。

One API 做的第一件事，就是把这些差异全部抹平——对外只暴露一个地址，所有请求都按 OpenAI 规范接收，内部自动路由、转换、重试、兜底。

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

/v1/chat/completions

docker run --name one-api -d \
 --restart always \
 -p 13000:3000 \
 -e TZ=Asia/Shanghai \
 -v $(pwd)/oneapi-data:/data \
 justsong/one-api

version: '3.8'
services:
  oneapi:
    container_name: oneapi
    image: justsong/one-api:latest
    restart: unless-stopped
    ports:
      - "13000:3000"
    volumes:
      - ./oneapi-data:/data
    environment:
      - TZ=Asia/Shanghai
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:3000/health"]
      interval: 30s
      timeout: 10s
      retries: 3

docker-compose up -d

{
  "id": "chatcmpl-xxx",
  "object": "chat.completion",
  "created": 1717021234,
  "model": "glm-4",
  "choices": [
    {
      "index": 0,
      "message": {"role": "assistant", "content": "你好！我是 GLM-4，很高兴为你服务。"},
      "finish_reason": "stop"
    }
  ]
}

from openai import OpenAI

# 关键：只改 base_url 和 api_key，其余完全不变
client = OpenAI(
    base_url="http://localhost:13000/v1",  # 指向你的 One API
    api_key="sk-xxx-your-one-api-token"    # 从 One API 后台生成的令牌
)

response = client.chat.completions.create(
    model="glm-4",                        # 指定调用 ChatGLM
    messages=[{"role": "user", "content": "用 Python 写一个快速排序"}],
    temperature=0.7
)
print(response.choices[0].message.content)

curl http://localhost:13000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxx-your-one-api-token" \
  -d '{ "model": "qwen-max", "messages": [{"role": "user", "content": "请解释 Transformer 架构的核心思想"}], "stream": false }'

response = client.chat.completions.create(
    model="glm-4",
    messages=[{"role": "user", "content": "写一首关于春天的七言绝句"}],
    stream=True  # 关键：启用流式
)
for chunk in response:
    if chunk.choices[0].delta.content is not None:
        print(chunk.choices[0].delta.content, end='', flush=True)

One API 统一调用 ChatGLM/文心一言等 20+ 大模型

One API 统一调用 ChatGLM/文心一言等 20+ 大模型

1. 为什么你需要 One API：统一接口不是噱头，而是真实痛点

1.1 接口协议五花八门，适配成本远超预期

更多推荐文章

相关免费在线工具

1.2 权限与用量管理缺失，团队协作风险高

1.3 部署极简，但能力不妥协

2. 三分钟完成部署：Docker 一键启动，不碰配置文件

2.1 方式一：单命令快速体验（推荐首次尝试）

2.2 方式二：docker-compose 长期使用（推荐生产环境）

3. 配置你的第一个模型通道：以 ChatGLM 和文心一言为例

3.1 添加 ChatGLM 渠道（智谱 AI）

3.2 添加文心一言渠道（百度）

3.3 验证通道是否生效

4. 调用实操：用 Python/Shell/Postman，零改造接入

4.1 Python 调用（兼容 openai==1.0+）

4.2 curl 命令行调用（调试利器）

4.3 Postman 配置（可视化调试）

5. 进阶能力：让统一调用真正服务于业务

5.1 场景一：为不同客户分配专属模型池（权限隔离）

5.2 场景二：流式响应实现'打字机效果'

5.3 场景三：失败自动重试 + 多渠道兜底

6. 总结：统一接口，是 AI 工程化的起点而非终点

更多推荐文章

相关免费在线工具

One API 统一调用 ChatGLM/文心一言等 20+ 大模型

One API 统一调用 ChatGLM/文心一言等 20+ 大模型

1. 为什么你需要 One API：统一接口不是噱头，而是真实痛点

1.1 接口协议五花八门，适配成本远超预期

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.2 权限与用量管理缺失，团队协作风险高

1.3 部署极简，但能力不妥协

2. 三分钟完成部署：Docker 一键启动，不碰配置文件

2.1 方式一：单命令快速体验（推荐首次尝试）

2.2 方式二：docker-compose 长期使用（推荐生产环境）

3. 配置你的第一个模型通道：以 ChatGLM 和文心一言为例

3.1 添加 ChatGLM 渠道（智谱 AI）

3.2 添加文心一言渠道（百度）

3.3 验证通道是否生效

4. 调用实操：用 Python/Shell/Postman，零改造接入

4.1 Python 调用（兼容 openai==1.0+）

4.2 curl 命令行调用（调试利器）

4.3 Postman 配置（可视化调试）

5. 进阶能力：让统一调用真正服务于业务

5.1 场景一：为不同客户分配专属模型池（权限隔离）

5.2 场景二：流式响应实现'打字机效果'

5.3 场景三：失败自动重试 + 多渠道兜底

6. 总结：统一接口，是 AI 工程化的起点而非终点

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具