支持 ChatGLM 与文心一言的 API 管理镜像部署指南 | 极客日志

Shell / BashSaaSAI

支持 ChatGLM 与文心一言的 API 管理镜像部署指南

介绍基于 Docker 部署支持 ChatGLM、文心一言等主流大模型的 API 管理镜像方案。通过命令行快速启动服务，配置渠道密钥实现统一 OpenAI 标准接口调用。涵盖首次登录安全加固、多模型渠道添加、令牌管理与额度审计、HTTPS 配置及生产环境优化。业务代码无需修改即可切换不同模型，并支持负载均衡兜底策略。系统内置权限分级、流量控制及安全告警功能，适合企业级 AI 基础设施搭建。

王者发布于 2026/4/6更新于 2026/7/2060 浏览

支持 ChatGLM 与文心一言的 API 管理镜像部署指南

1. 背景与需求

在项目中同时调用多个大模型（如文心一言、ChatGLM、通义千问等）时，常面临以下问题：

每个模型需单独配置 api_key、base_url、请求头格式及流式开关逻辑；
不同环境切换模型时，因字段命名差异（如 temperature vs top_p）导致报错；
密钥过期或泄露难以追踪具体服务。

解决方案是引入统一的 API 网关层。该镜像将所有主流大模型的差异封装，对外暴露标准 OpenAI API 接口。业务代码无需修改即可切换后端模型，并内置密钥管理、流量控制、额度审计等功能。

2. 三步完成部署

以 Linux 服务器（Ubuntu/CentOS）为例，全程耗时约 3 分钟。

2.1 拉取并启动镜像

# 一行命令拉取并后台运行（使用默认端口 3000）
docker run -d \
  --name one-api \
  -p 3000:3000 \
  -v /path/to/one-api-data:/app/data \
  --restart=always \
  registry.cn-hangzhou.aliyuncs.com/one-api/one-api:latest

说明：-v 参数将容器内数据目录挂载到宿主机，确保重启后配置不丢失；--restart=always 让容器随系统自启。

等待 10 秒后，执行：

docker logs one-api | grep "Server is running"

看到类似 Server is running on http://localhost:3000 即表示启动成功。

2.2 首次登录与安全加固

打开浏览器，访问 http://你的服务器 IP:3000。 重要提醒：首次必须用 root 用户登录，初始密码为 123456。登录后第一件事：立即修改密码。点击右上角头像 → '修改密码'，设置强密码。否则任何知道 IP 的人都能接管 API 网关。

2.3 添加文心一言渠道

进入左侧菜单【渠道管理】→ 点击【+ 新建渠道】：

字段	填写内容	说明
渠道名称	`百度文心一言`	自定义，便于识别
渠道类型	`文心一言`	下拉选择
API Key	`your_ernie_api_key`	从百度千帆控制台获取的 SK 密钥
Base URL	`https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro`	文心一言官方 V3 接口地址
模型名称	`ernie-4.5-turbo`	填你实际开通的模型

点击【保存】。若显示绿色对勾，说明接入成功。

2.4 创建令牌并调用

进入【令牌管理】→ 【+ 新建令牌】：

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

curl -X POST "http://你的服务器 IP:3000/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-xxx" \
  -d '{ "model": "ernie-4.5-turbo", "messages": [ {"role": "user", "content": "用中文写一段关于人工智能发展的简短评论" } ], "stream": false }'

字段	填写内容
渠道名称	`智谱 ChatGLM-4`
渠道类型	`ChatGLM`
API Key	`your_glm_api_key`
Base URL	`https://open.bigmodel.cn/api/paas/v4/chat/completions`
模型名称	`glm-4-flash`

# api_client.py —— 你的业务代码，永远不变
import requests

def generate_copy(model_name: str, prompt: str):
    url = "http://你的服务器 IP:3000/v1/chat/completions"
    headers = {
        "Content-Type": "application/json",
        "Authorization": "Bearer sk-xxx"
    }
    data = {
        "model": model_name,
        "messages": [{"role": "user", "content": prompt}],
        "max_tokens": 512,
        "temperature": 0.7
    }
    response = requests.post(url, headers=headers, json=data)
    return response.json()["choices"][0]["message"]["content"]

# 调用文心一言
wenxin_result = generate_copy("ernie-4.5-turbo", "为智能手表写一句吸引年轻人的广告语")
# 调用 ChatGLM-4
glm_result = generate_copy("glm-4-flash", "为智能手表写一句吸引年轻人的广告语")

支持 ChatGLM 与文心一言的 API 管理镜像部署指南

支持 ChatGLM 与文心一言的 API 管理镜像部署指南

1. 背景与需求

2. 三步完成部署

2.1 拉取并启动镜像

2.2 首次登录与安全加固

2.3 添加文心一言渠道

2.4 创建令牌并调用

更多推荐文章

相关免费在线工具

3. ChatGLM 与文心一言的实操对比

3.1 添加 ChatGLM 渠道

3.2 同一份代码，切换模型只需改一个参数

3.3 进阶技巧：用负载均衡实现模型兜底

4. 密钥管理、额度审计与安全控制

4.1 密钥分级管理

4.2 额度实时审计

4.3 安全加固

5. 生产环境必做的 5 项配置优化

5.1 修改系统基础信息

5.2 启用 HTTPS

5.3 设置默认模型与流式开关

5.4 配置邮件服务

5.5 多机部署准备

6. 总结

更多推荐文章

相关免费在线工具

支持 ChatGLM 与文心一言的 API 管理镜像部署指南

支持 ChatGLM 与文心一言的 API 管理镜像部署指南

1. 背景与需求

2. 三步完成部署

2.1 拉取并启动镜像

2.2 首次登录与安全加固

2.3 添加文心一言渠道

2.4 创建令牌并调用

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. ChatGLM 与文心一言的实操对比

3.1 添加 ChatGLM 渠道

3.2 同一份代码，切换模型只需改一个参数

3.3 进阶技巧：用负载均衡实现模型兜底

4. 密钥管理、额度审计与安全控制

4.1 密钥分级管理

4.2 额度实时审计

4.3 安全加固

5. 生产环境必做的 5 项配置优化

5.1 修改系统基础信息

5.2 启用 HTTPS

5.3 设置默认模型与流式开关

5.4 配置邮件服务

5.5 多机部署准备

6. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具