Docker + Nginx 实现 Java 服务零停机发布，解决 502 问题 | 极客日志

Javajava

Docker + Nginx 实现 Java 服务零停机发布，解决 502 问题

总结了在 Docker Compose 加 Nginx 架构下部署 SpringBoot 等 Java 服务时遇到的发布期间 502 错误问题。通过双实例兜底策略，结合 Nginx 的 proxy_next_upstream 自动重试机制以及健康检查脚本，实现了零停机发布。核心步骤包括配置 Nginx upstream 备用节点、编写 Docker Compose 定义主备服务、以及使用 Shell 脚本控制启动顺序和健康状态轮询。该方案适用于无 Kubernetes 环境的中小企业，确保发布过程用户无感知且接口稳定。

灵魂摆渡发布于 2026/3/30更新于 2026/7/2353 浏览

一、前言

在传统服务器部署中，我们更新后端服务通常是：

停止旧容器
启动新容器

这个过程会直接导致：

发布期间接口 502 Bad Gateway
用户访问中断、前端报错
监控告警、接口超时失败

即使使用'先启动临时实例、再关闭旧实例'，如果 Nginx 配置、健康检查、脚本逻辑不正确，依然会出现各种诡异问题：发布瞬间 502、脚本卡死、接口不通等。

本文带你从零搭建一套真正可用、无感知、零停机的发布方案。

二、遇到的典型问题（你大概率也踩过）

直接重启容器 → 必现 502

原因：主容器重启期间，Nginx 仍在转发请求，无可用后端服务。

加了 backup 副本 → 依然偶尔 502

upstream ring_servers {
    server ring:8080;
    server ring_temp:8080 backup;
}

原因：

backup 只有主节点完全挂掉才会切换
Nginx 没有失败重试机制，重启瞬间仍会丢请求
健康检查不及时

发布脚本检查接口 → 直接卡死

原因：

接口未就绪时，curl 阻塞等待
检查公网入口受 Nginx 影响，无法真实判断服务状态

健康检查接口被登录拦截 → 返回 401

原因：健康接口走了登录校验，HTTP 200 但业务码 401，导致脚本误判。

三、整体零停机发布方案（通用架构）

核心思路：双实例兜底 + Nginx 自动重试 + 安全发布脚本

正常运行：主服务提供流量
发布时：先启动临时副本 → 等待就绪 → 重启主服务 → 主服务就绪 → 关闭临时副本
Nginx：自动转发到可用节点，用户无感知

四、第一步：Nginx 配置（最关键，解决 502）

upstream 负载均衡配置

upstream ring_servers {
    least_conn; # 主服务
    server ring:8080 max_fails=1 fail_timeout=1s;
    # 临时服务（发布兜底，backup 模式）
    server ring_temp:8080 max_fails=3 fail_timeout=30s backup;
    # 核心：出错自动重试下一个节点，用户看不到 502
    proxy_next_upstream error timeout invalid_header http_500 http_502 http_503 http_504;
    proxy_next_upstream_tries 2;
    keepalive 32;
}

代理通用配置

proxy_connect_timeout 10s;
proxy_send_timeout 10s;
proxy_read_timeout 30s;
proxy_buffering on;

说明：proxy_next_upstream 是零停机的灵魂，请求失败会自动重试下一个节点。

五、第二步：docker-compose.yml 配置

只保留核心结构，可直接套用：

version: "3.9"
services:
  # 主服务
  
     
     
    
       
    
       
    
       [, , , , , , , ]

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

#!/bin/bash
set +e
# ==================== 配置项（根据自己项目修改） ====================
# 公网要监控的接口（验证用户是否能正常访问）
MONITOR_URL="https://你的域名/api/app/checkServerStatus"
# 主服务端口检查（不经过 Nginx）
MAIN_CHECK_URL="http://127.0.0.1:8080/api/app/checkServerStatus"
# 临时服务端口检查
TEMP_CHECK_URL="http://127.0.0.1:8081/api/app/checkServerStatus"
MAX_RETRY=30
RETRY_INTERVAL=5
# ====================================================================
# 后台实时监控公网接口
start_monitor(){
    while true; do
        current_time=$(date "+%Y-%m-%d %H:%M:%S")
        HTTP_CODE=$(curl -s -o /dev/null -w "%{http_code}" --insecure $MONITOR_URL 2>/dev/null)
        if [ "$HTTP_CODE" = "200" ]; then
            echo -e "\033[32m[${current_time}] ✅ 公网接口正常：200\033[0m"
        else
            echo -e "\033[31m[${current_time}] ❌ 公网接口异常：${HTTP_CODE}\033[0m"
        fi
        sleep 1
    done
}
# 检查端口服务是否就绪
check_service_ready(){
    local url=$1
    local desc=$2
    echo -e "\033[36m=== 等待 ${desc} 就绪 ===\033[0m"
    local retry=0
    while [ $retry -lt $MAX_RETRY ]; do
        code=$(curl -s -o /dev/null -w "%{http_code}" --insecure $url 2>/dev/null)
        if [ "$code" = "200" ]; then
            echo -e "\033[32m✅ ${desc} 启动成功\033[0m"
            return 0
        fi
        retry=$((retry+1))
        echo "重试 ${retry}/${MAX_RETRY}，状态码：${code}，等待 ${RETRY_INTERVAL}s..."
        sleep $RETRY_INTERVAL
    done
    echo -e "\033[31m❌ ${desc} 启动超时\033[0m"
    kill $MONITOR_PID 2>/dev/null
    exit 1
}
# ==================== 发布主流程 ====================
echo -e "\n==================== 开始零停机发布 ====================\n"

# 1. 启动后台监控
start_monitor &
MONITOR_PID=$!

# 2. 启动临时副本
echo -e "\n1. 启动临时服务"
docker compose up -d ring_temp
check_service_ready "$TEMP_CHECK_URL" "临时服务"

# 3. 重启主服务
echo -e "\n2. 重启主服务"
docker compose up -d --force-recreate ring
check_service_ready "$MAIN_CHECK_URL" "主服务"

# 4. 关闭临时服务
echo -e "\n3. 关闭临时服务"
docker compose stop ring_temp
docker compose rm -f ring_temp

# 5. 停止监控
kill $MONITOR_PID 2>/dev/null
sleep 1
echo -e "\n\033[32m=====================================================\033[0m"
echo -e "\033[32m✅ 发布完成！全程无 502，用户无感知\033[0m"
echo -e "\033[32m=====================================================\033[0m"
exit 0

chmod +x deploy_ring.sh

./deploy_ring.sh

Docker + Nginx 实现 Java 服务零停机发布，解决 502 问题

一、前言

二、遇到的典型问题（你大概率也踩过）

三、整体零停机发布方案（通用架构）

四、第一步：Nginx 配置（最关键，解决 502）

五、第二步：docker-compose.yml 配置

更多推荐文章

相关免费在线工具

六、第三步：生产可用零停机发布脚本

七、第四步：使用与验证

八、核心避坑总结（非常重要）

九、适用场景

更多推荐文章

相关免费在线工具

Docker + Nginx 实现 Java 服务零停机发布，解决 502 问题

一、前言

二、遇到的典型问题（你大概率也踩过）

三、整体零停机发布方案（通用架构）

四、第一步：Nginx 配置（最关键，解决 502）

五、第二步：docker-compose.yml 配置

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

六、第三步：生产可用零停机发布脚本

七、第四步：使用与验证

八、核心避坑总结（非常重要）

九、适用场景

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具