WebSphere 节点不同步问题排查与解决
在 WebSphere Application Server (WAS) 运维中,节点不同步是一个常见且棘手的问题。它通常表现为应用部署失败、启动缓慢或控制台状态显示异常。以下总结了典型症状及经过验证的修复步骤。
常见症状
- 启动超时:启动应用时特别慢,日志提示'可能已经启动成功,但没有在预定的时间启动完成'。
- 状态显示错误:在 WebSphere 企业应用程序控制台中,已启动的应用仍显示为'红 X'状态。
- 同步状态异常:系统管理下的节点状态显示未同步,执行同步操作后依然无效。
- Token 连接拒绝:部署新应用时报错
DefaultTokenP I HMGR0149E: 尝试打开到核心组 DefaultCoreGroup 的连接被拒绝,且伴随WSVR0215W: 启动应用程序...失败。尚未安装该应用程序警告,尽管部署日志看似正常。
解决方案
当遇到上述情况时,通常是因为临时缓存文件损坏或配置不一致导致。请按以下步骤操作,注意服务启停顺序至关重要。
1. 停止相关服务
首先切换到对应目录,严格按照 Server -> Node -> DMGR 的顺序停止服务。
# 停止应用服务器
/opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/stopServer.sh server1 --servername
# 停止节点代理
/opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/stopNode.sh
# 停止部署管理器
/opt/IBM/WebSphere/AppServer/bin/stopManager.sh
2. 清理临时文件
删除可能导致冲突的临时缓存目录内容。重点清理 DMGR 和 Profile 下的 temp 文件夹。
# 清理 DMGR 临时文件
rm -rf /opt/IBM/WebSphere/AppServer/profiles/Dmgr01/temp/*
rm -rf /opt/IBM/WebSphere/AppServer/profiles/Dmgr01/config/temp/*
# 清理工作空间临时文件(根据实际路径调整)
rm -rf wstemp/*
rm -rf tranlog/*
3. 重新同步节点
切换至应用服务器 Profile 的 bin 目录下,执行同步命令。请确保参数中的主机名与实际一致。
cd /opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/
syncNode.sh <CellName> <PortNumber> -username <AdminUser> -password <AdminPassword>
注:主机名可通过 uname -a 获取(Linux 下),例如输出中的第二项即为机器名。
4. 重启服务
同步完成后,按 DMGR -> Node -> Server 的顺序依次启动服务。
# 启动部署管理器
/opt/IBM/WebSphere/AppServer/bin/startManager.sh
# 启动节点代理
/opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/startNode.sh
/opt/IBM/WebSphere/AppServer/profiles/AppSrv02/bin/startServer.sh server1 --servername

