支持 ChatGLM/文心一言的 API 管理镜像部署手册 | 极客日志

Shell / BashSaaSAI

支持 ChatGLM/文心一言的 API 管理镜像部署手册

一款支持 ChatGLM、文心一言等主流大模型的 API 管理镜像部署方案。通过 Docker 一键启动，提供统一的 OpenAI 标准接口，屏蔽底层模型差异。内容包括渠道配置、令牌管理、负载均衡策略及生产环境安全加固（HTTPS、额度审计）。开发者无需修改业务代码即可在不同模型间自由切换，实现企业级 AI 中台能力。

MqEngine发布于 2026/4/6更新于 2026/7/1862 浏览

支持 ChatGLM/文心一言的 API 管理镜像部署手册

1. 背景：统一 API 网关的必要性

在大模型应用开发中，常遇到以下问题：

项目同时调用多个模型（如文心一言、ChatGLM、通义千问），每个模型需单独配置 api_key、base_url 及请求头格式；
测试环境使用本地 Ollama，生产环境切换至云端服务时，因字段命名差异（如 temperature vs top_p）导致报错；
运维难以追踪各微服务中的 API 密钥状态，密钥过期易引发线上故障。

解决方案是引入统一的 API 网关层。该镜像将所有主流大模型的差异封装，对外暴露标准的 OpenAI API 接口。业务代码无需修改即可在不同模型或服务商间切换，并内置密钥管理、流量控制、额度审计等功能。

2. 部署步骤

整个过程无需编译，不依赖 Python 环境，仅需终端命令。以 Linux 服务器（Ubuntu/CentOS）为例。

2.1 拉取并启动镜像

# 一行命令拉取并后台运行（默认端口 3000）
docker run -d \
  --name one-api \
  -p 3000:3000 \
  -v /path/to/one-api-data:/app/data \
  --restart=always \
  registry.cn-hangzhou.aliyuncs.com/one-api/one-api:latest

说明：-v 参数将容器内数据目录挂载到宿主机，确保重启后配置不丢失；--restart=always 让容器随系统自启。

等待 10 秒后，执行：

docker logs one-api | grep "Server is running"

看到类似 Server is running on http://localhost:3000 即表示启动成功。

2.2 首次登录与安全加固

打开浏览器访问 http://你的服务器 IP:3000。首次必须用 root 用户登录，初始密码为 123456。

登录后第一件事：立即修改密码。点击右上角头像 → '修改密码'，设置强密码。否则任何知道 IP 的人都能接管 API 网关。

2.3 添加文心一言渠道

进入左侧菜单【渠道管理】→ 点击【+ 新建渠道】：

字段	填写内容	说明
渠道名称	`百度文心一言`	自定义，便于识别
渠道类型	`文心一言`	下拉选择
API Key	`your_ernie_api_key`	从百度千帆控制台获取
Base URL	`https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro`	文心一言官方 V3 接口地址
模型名称	`ernie-4.5-turbo`	填实际开通的模型

点击【保存】，若显示绿色对勾，说明接入成功。

2.4 创建令牌并调用

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

curl -X POST "http://你的服务器 IP:3000/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxx" \
  -d '{ "model": "ernie-4.5-turbo", "messages": [ {"role": "user", "content": "用中文写一段关于人工智能发展的简短评论" } ], "stream": false }'

字段	填写内容
渠道名称	`智谱 ChatGLM-4`
渠道类型	`ChatGLM`
API Key	`your_glm_api_key`
Base URL	`https://open.bigmodel.cn/api/paas/v4/chat/completions`
模型名称	`glm-4-flash`

# api_client.py —— 你的业务代码，永远不变
import requests

def generate_copy(model_name: str, prompt: str):
    url = "http://你的服务器 IP:3000/v1/chat/completions"
    headers = {
        "Content-Type": "application/json",
        "Authorization": "Bearer sk-xxx"
    }
    data = {
        "model": model_name, # ← 关键！只改这里
        "messages": [{"role": "user", "content": prompt}],
        "max_tokens": 512,
        "temperature": 0.7
    }
    response = requests.post(url, headers=headers, json=data)
    return response.json()["choices"][0]["message"]["content"]

# 调用文心一言
wenxin_result = generate_copy("ernie-4.5-turbo", "为智能手表写一句吸引年轻人的广告语")
# 调用 ChatGLM-4
glm_result = generate_copy("glm-4-flash", "为智能手表写一句吸引年轻人的广告语")

支持 ChatGLM/文心一言的 API 管理镜像部署手册

支持 ChatGLM/文心一言的 API 管理镜像部署手册

1. 背景：统一 API 网关的必要性

2. 部署步骤

2.1 拉取并启动镜像

2.2 首次登录与安全加固

2.3 添加文心一言渠道

2.4 创建令牌并调用

更多推荐文章

相关免费在线工具

3. 模型调用与切换

3.1 添加 ChatGLM 渠道

3.2 同一份代码，切换模型只需改一个参数

3.3 进阶技巧：负载均衡实现兜底

4. 密钥管理与安全控制

4.1 密钥分级管理

4.2 额度实时审计

4.3 安全加固

5. 生产环境配置优化

5.1 修改系统基础信息

5.2 启用 HTTPS

5.3 设置默认模型与流式开关

5.4 配置邮件服务

5.5 多机部署准备

6. 总结

更多推荐文章

相关免费在线工具

支持 ChatGLM/文心一言的 API 管理镜像部署手册

支持 ChatGLM/文心一言的 API 管理镜像部署手册

1. 背景：统一 API 网关的必要性

2. 部署步骤

2.1 拉取并启动镜像

2.2 首次登录与安全加固

2.3 添加文心一言渠道

2.4 创建令牌并调用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 模型调用与切换

3.1 添加 ChatGLM 渠道

3.2 同一份代码，切换模型只需改一个参数

3.3 进阶技巧：负载均衡实现兜底

4. 密钥管理与安全控制

4.1 密钥分级管理

4.2 额度实时审计

4.3 安全加固

5. 生产环境配置优化

5.1 修改系统基础信息

5.2 启用 HTTPS

5.3 设置默认模型与流式开关

5.4 配置邮件服务

5.5 多机部署准备

6. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具