100 台服务器批量运维：Shell+Ansible 一键管控与避坑指南 | 极客日志

Shell / Bash

100 台服务器批量运维：Shell+Ansible 一键管控与避坑指南

基于 SSH 协议实现 100 台服务器的批量运维，涵盖 Shell+SSH 基础脚本与 Ansible 进阶方案。内容包括批量执行命令、文件分发、状态监控及网络、权限、效率等方面的避坑指南。生产环境推荐使用密钥认证与 Ansible 工具，通过分批执行与日志记录保障安全高效管理。

深海蔚蓝发布于 2026/3/16更新于 2026/6/1729 浏览

批量服务器操作实战：100 台服务器一键管控（含脚本 + 避坑指南）

在大规模服务器运维场景中，手动逐台操作 100 台服务器不仅效率低下，还极易出现人为失误。本文将基于 SSH 协议实现 100 台服务器的一键管控，涵盖批量执行命令、文件分发、状态监控等核心功能，并结合实战经验梳理避坑指南，帮助你高效、安全地管理服务器集群。

一、前置准备

1. 核心依赖

环境要求：控制端为 Linux 系统（推荐 CentOS7+/Ubuntu18.04+），被控端为 Linux 系统（主流发行版均可）。
核心工具：
- sshpass：免交互输入 SSH 密码（测试环境可用，生产环境优先密钥认证）；
- ansible（可选）：进阶批量运维工具，本文先基于原生 Shell+SSH 实现基础版，再补充 Ansible 进阶方案；
- parallel-ssh：高性能并行 SSH 工具，适合大规模服务器批量操作。

2. 环境初始化（控制端）

# CentOS/RHEL
yum install -y sshpass openssh-clients parallel-ssh

# Ubuntu/Debian
apt update && apt install -y sshpass openssh-clients pssh

3. 服务器信息整理

新建服务器清单文件 server_list.txt，格式为 IP:端口：用户名：密码（生产环境建议仅保留 IP，用密钥认证）：

192.168.1.10:22:root:Passwd@123
192.168.1.11:22:root:Passwd@123
192.168.1.12:22:root:Passwd@123
# ... 共 100 台服务器，按此格式补充

二、核心脚本实现（基础版：Shell+SSH）

1. 批量执行命令脚本（run_cmd.sh）

该脚本可一键在 100 台服务器上执行指定命令（如查看内存、重启服务、安装软件等）。

#!/bin/bash
# 批量执行命令脚本
# 使用方式：./run_cmd.sh "要执行的命令"


 [  -ne 1 ]; 
     
     1


CMD=
SERVER_LIST=
LOG_DIR=
 -p 


 IFS=  -r IP PORT USER PASS; 
    
     [[ -z  ||  =~ ^# ]]; 
        
    
     
    
    
    sshpass -p  ssh -o StrictHostKeyChecking=no -p  @  >  2>&1
    
    
     [ $? -eq 0 ]; 
         
    
         
    
 <

相关免费在线工具

Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online
JSON美化和格式化
将JSON字符串修饰为友好的可读格式。在线工具，JSON美化和格式化在线工具，online

#!/bin/bash
# 批量分发文件脚本
# 使用方式：./send_file.sh 本地文件路径 目标服务器路径

# 检查参数
if [ $# -ne 2 ]; then
    echo "用法错误！示例：./send_file.sh /local/test.txt /remote/test.txt"
    exit 1
fi

LOCAL_FILE=$1
REMOTE_PATH=$2
SERVER_LIST="./server_list.txt"
LOG_DIR="./batch_log"
mkdir -p $LOG_DIR

# 检查本地文件是否存在
if [ ! -f "$LOCAL_FILE" ]; then
    echo "错误：本地文件 $LOCAL_FILE 不存在！"
    exit 1
fi

# 遍历服务器分发文件
while IFS=":" read -r IP PORT USER PASS; do
    if [[ -z $IP || $IP =~ ^# ]]; then
        continue
    fi
    echo "===== 开始分发到 $IP ====="
    
    # 核心命令：scp 免交互分发文件
    sshpass -p "$PASS" scp -o StrictHostKeyChecking=no -P "$PORT" "$LOCAL_FILE" "$USER"@"$IP":"$REMOTE_PATH" > "$LOG_DIR/$IP.send.log" 2>&1
    
    if [ $? -eq 0 ]; then
        echo "$IP 分发成功，日志：$LOG_DIR/$IP.send.log"
    else
        echo "$IP 分发失败，日志：$LOG_DIR/$IP.send.log"
    fi
done < "$SERVER_LIST"

echo "===== 所有服务器分发完成 ====="

# 1. 批量查看所有服务器内存使用情况
chmod +x run_cmd.sh
./run_cmd.sh "free -m"

# 2. 批量分发 nginx 配置文件到所有服务器
chmod +x send_file.sh
./send_file.sh /etc/nginx/nginx.conf /etc/nginx/nginx.conf

# 3. 批量重启 nginx 服务
./run_cmd.sh "systemctl restart nginx && systemctl status nginx"

# CentOS/RHEL
yum install -y ansible

# Ubuntu/Debian
apt install -y ansible

[servers]
192.168.1.10 ansible_ssh_port=22 ansible_ssh_user=root ansible_ssh_pass=Passwd@123
192.168.1.11 ansible_ssh_port=22 ansible_ssh_user=root ansible_ssh_pass=Passwd@123
# ... 补充剩余 98 台服务器

# 1. 批量执行命令（查看内存）
ansible servers -m command -a "free -m"

# 2. 批量分发文件
ansible servers -m copy -a "src=/etc/nginx/nginx.conf dest=/etc/nginx/nginx.conf"

# 3. 批量安装软件（如 nginx）
ansible servers -m yum -a "name=nginx state=installed"

# 4. 批量重启服务并检查状态
ansible servers -m service -a "name=nginx state=restarted"
ansible servers -m command -a "systemctl status nginx | grep Active"

# 5. 并行执行（指定并发数，100 台建议设 50）
ansible servers -f 50 -m command -a "df -h"

100 台服务器批量运维：Shell+Ansible 一键管控与避坑指南

批量服务器操作实战：100 台服务器一键管控（含脚本 + 避坑指南）

一、前置准备

1. 核心依赖

2. 环境初始化（控制端）

3. 服务器信息整理

二、核心脚本实现（基础版：Shell+SSH）

1. 批量执行命令脚本（run_cmd.sh）

更多推荐文章

相关免费在线工具

2. 批量分发文件脚本（send_file.sh）

3. 脚本使用示例

三、进阶方案：Ansible 批量管控（推荐生产环境）

1. Ansible 配置

（1）安装 Ansible

（2）配置主机清单（/etc/ansible/hosts）

2. Ansible 一键管控示例

四、实战避坑指南（100 台服务器必看）

1. 网络与连接类坑

2. 权限与安全类坑

3. 执行效率与稳定性类坑

4. 业务影响类坑

五、脚本优化建议（适配 100 台规模）

总结

更多推荐文章

相关免费在线工具

100 台服务器批量运维：Shell+Ansible 一键管控与避坑指南

批量服务器操作实战：100 台服务器一键管控（含脚本 + 避坑指南）

一、前置准备

1. 核心依赖

2. 环境初始化（控制端）

3. 服务器信息整理

二、核心脚本实现（基础版：Shell+SSH）

1. 批量执行命令脚本（run_cmd.sh）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 批量分发文件脚本（send_file.sh）

3. 脚本使用示例

三、进阶方案：Ansible 批量管控（推荐生产环境）

1. Ansible 配置

（1）安装 Ansible

（2）配置主机清单（/etc/ansible/hosts）

2. Ansible 一键管控示例

四、实战避坑指南（100 台服务器必看）

1. 网络与连接类坑

2. 权限与安全类坑

3. 执行效率与稳定性类坑

4. 业务影响类坑

五、脚本优化建议（适配 100 台规模）

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具