支持 ChatGLM/文心一言的 API 管理镜像部署手册 | 极客日志

Shell / BashAI算法

支持 ChatGLM/文心一言的 API 管理镜像部署手册

支持 ChatGLM、文心一言等多模型的 API 管理镜像部署方案。通过 Docker 快速启动，实现统一 OpenAI 接口调用，屏蔽底层模型差异。包含密钥管理、流量控制、额度审计及安全配置功能。生产环境可配置 HTTPS、负载均衡及多机部署，满足企业级 AI 中台需求。业务代码无需修改即可切换不同大模型服务商。

片刻发布于 2026/4/7更新于 2026/7/2339 浏览

支持 ChatGLM/文心一言的 API 管理镜像部署手册

1. 为什么你需要这个镜像——告别密钥混乱与模型适配烦恼

你是否遇到过这样的场景：

项目里同时调用文心一言写营销文案、用 ChatGLM 做内部知识问答、再接入通义千问生成技术文档，结果每个模型都要单独配置 api_key、base_url、请求头格式、流式开关逻辑……代码里堆满条件判断；
测试环境用的是本地 Ollama 的 Qwen2，生产环境切到百度千帆的文心一言 4.5，一改 base_url 和模型名，就报 400 Bad Request——原来千帆不支持 OpenAI 原生的 temperature 字段命名，得改成 top_p；
运维同事半夜被报警电话叫醒：'线上服务崩了！查了一小时发现是讯飞星火的 API 密钥过期了，但没人知道它被用在哪个微服务里……'

这些问题，不是你代码写得不够好，而是缺一个统一的 API 网关层。

这不是一个需要你从零搭建的复杂系统，而是一个真正'开箱即用'的镜像——它把所有主流大模型（包括 ChatGLM、文心一言、通义千问、讯飞星火等）的差异全部封装掉，对外只暴露标准的 OpenAI API 接口。你写的代码，今天调用本地 Ollama，明天切到百度千帆，后天换成 Azure OpenAI，完全不用改一行业务逻辑。

更关键的是：它不只做协议转换。它内置密钥管理、流量控制、额度审计、多渠道负载均衡、用户分组权限、甚至支持微信/飞书/邮箱登录——你拿到的不是一个工具，而是一套可直接交付给客户或上线生产的小型 AI 中台。

下面，我们就从零开始，用最直白的方式，带你完成一次完整部署。

2. 三步完成部署：从拉取镜像到调用文心一言

整个过程不需要编译、不依赖 Python 环境、不修改配置文件——所有操作都在终端敲几行命令。我们以最常见的 Linux 服务器（Ubuntu/CentOS）为例，全程耗时约 3 分钟。

2.1 拉取并启动镜像（10 秒）

# 一行命令拉取并后台运行（使用默认端口 3000）
docker run -d \
 --name one-api \
 -p 3000:3000 \
 -v /path/to/one-api-data:/app/data \
 --restart=always \
 registry.cn-hangzhou.aliyuncs.com/one-api/one-api:latest

说明：-v 参数将容器内数据目录挂载到宿主机，确保重启后配置不丢失；--restart=always 让容器随系统自启，适合生产环境；镜像已预置所有依赖，无需额外安装 Node.js 或数据库。

等待 10 秒后，执行：

docker logs one-api | grep "Server is running"

看到类似 Server is running on http://localhost:3000 即表示启动成功。

2.2 首次登录与安全加固（30 秒）

打开浏览器，访问 http://你的服务器 IP:3000，你会看到登录页。 重要提醒：首次必须用 root 用户登录，初始密码为 123456（这是镜像文档明确强调的安全要求）。

登录后第一件事：立即修改密码。点击右上角头像 → '修改密码'，输入旧密码 123456，设置强密码（建议含大小写字母 + 数字 + 符号）。这一步不可跳过——否则任何知道 IP 的人都能接管你的 API 网关。

2.3 添加文心一言渠道（2 分钟）

进入左侧菜单【渠道管理】→ 点击【+ 新建渠道】：

字段	填写内容	说明

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

curl -X POST "http://你的服务器 IP:3000/v1/chat/completions" \
 -H "Content-Type: application/json" \
 -H "Authorization: Bearer sk-xxx" \
 -d '{ "model": "ernie-4.5-turbo", "messages": [ {"role": "user", "content": "用中文写一段关于人工智能发展的简短评论" } ], "stream": false }'

字段	填写内容
渠道名称	`智谱 ChatGLM-4`
渠道类型	`ChatGLM`
API Key	`your_glm_api_key`
Base URL	`https://open.bigmodel.cn/api/paas/v4/chat/completions`
模型名称	`glm-4-flash`

# api_client.py —— 你的业务代码，永远不变
import requests

def generate_copy(model_name: str, prompt: str):
    url = "http://你的服务器 IP:3000/v1/chat/completions"
    headers = {
        "Content-Type": "application/json",
        "Authorization": "Bearer sk-xxx" # 你创建的令牌
    }
    data = {
        "model": model_name, # ← 关键！只改这里
        "messages": [{"role": "user", "content": prompt}],
        "max_tokens": 512,
        "temperature": 0.7
    }
    response = requests.post(url, headers=headers, json=data)
    return response.json()["choices"][0]["message"]["content"]

# 调用文心一言
wenxin_result = generate_copy("ernie-4.5-turbo", "为智能手表写一句吸引年轻人的广告语")
# 调用 ChatGLM-4
glm_result = generate_copy("glm-4-flash", "为智能手表写一句吸引年轻人的广告语")

渠道名称	`百度文心一言`	自定义，便于识别
渠道类型	`文心一言`	下拉选择，非"OpenAI"或其他
API Key	`your_ernie_api_key`	从百度千帆控制台获取的 SK 密钥
Base URL	`https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro`	文心一言官方 V3 接口地址（注意：不是旧版 `completions`）
模型名称	`ernie-4.5-turbo`	填你实际开通的模型，如 `ernie-4.0-turbo`、`ernie-4.5-turbo`

支持 ChatGLM/文心一言的 API 管理镜像部署手册

支持 ChatGLM/文心一言的 API 管理镜像部署手册

1. 为什么你需要这个镜像——告别密钥混乱与模型适配烦恼

2. 三步完成部署：从拉取镜像到调用文心一言

2.1 拉取并启动镜像（10 秒）

2.2 首次登录与安全加固（30 秒）

2.3 添加文心一言渠道（2 分钟）

更多推荐文章

相关免费在线工具

2.4 创建令牌并调用（1 分钟）

3. ChatGLM 与文心一言的实操对比：同一套代码，两种模型自由切换

3.1 添加 ChatGLM 渠道（同样 3 步）

3.2 同一份代码，切换模型只需改一个参数

3.3 进阶技巧：用负载均衡实现模型兜底

4. 不止于调用：密钥管理、额度审计与安全控制

4.1 密钥分级管理：从个人到团队的权限体系

4.2 额度实时审计：每一笔调用都可追溯

4.3 安全加固：不止改密码，还有更多防线

5. 生产环境必做的 5 项配置优化

5.1 修改系统基础信息（1 分钟）

5.2 启用 HTTPS（强烈推荐，5 分钟）

5.3 设置默认模型与流式开关（提升体验）

5.4 配置邮件服务（用于密码重置）

更多推荐文章

相关免费在线工具

支持 ChatGLM/文心一言的 API 管理镜像部署手册

支持 ChatGLM/文心一言的 API 管理镜像部署手册

1. 为什么你需要这个镜像——告别密钥混乱与模型适配烦恼

2. 三步完成部署：从拉取镜像到调用文心一言

2.1 拉取并启动镜像（10 秒）

2.2 首次登录与安全加固（30 秒）

2.3 添加文心一言渠道（2 分钟）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.4 创建令牌并调用（1 分钟）

3. ChatGLM 与文心一言的实操对比：同一套代码，两种模型自由切换

3.1 添加 ChatGLM 渠道（同样 3 步）

3.2 同一份代码，切换模型只需改一个参数

3.3 进阶技巧：用负载均衡实现模型兜底

4. 不止于调用：密钥管理、额度审计与安全控制

4.1 密钥分级管理：从个人到团队的权限体系

4.2 额度实时审计：每一笔调用都可追溯

4.3 安全加固：不止改密码，还有更多防线

5. 生产环境必做的 5 项配置优化

5.1 修改系统基础信息（1 分钟）

5.2 启用 HTTPS（强烈推荐，5 分钟）

5.3 设置默认模型与流式开关（提升体验）

5.4 配置邮件服务（用于密码重置）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具