背景
公司进行 IT 硬件资源整合,将多台 Dell R 系列服务器整合为高配服务器。其中一台 Dell R720 在硬件升级(CPU 从 8 核增至 16 核,内存从 32G 增至 64G,硬盘扩容至 9TB)并安装 VMware ESXi 6.7.0 后出现开机报错。
故障现象
服务器面板提示以下错误信息:
问题 1: CPU0704 CPU1 machine check error detected. Power cycle system.
问题 2: E1245 CPU 2 错误
问题 3: cpu0000 cpu1 internal error (IERR) contact support -poweredge R720 server
排查过程
- BIOS 放电:拔掉 BIOS 电池,主板放电后测试,无效。
- 恢复出厂设置:将 BIOS 恢复出厂化设置,测试无效。
- 官网查询:记录 LED 面板滚动错误信息,按 Dell 官网建议操作,测试无效。
- iDRAC 远程管理:尝试登录 iDRAC 查看日志,因无密码或默认密码无法登录,此路不通。
解决方案
经过分析,推测是 Dell 服务器在 iDRAC 环境中保存了旧的硬件资源图。硬件更新后,若 iDRAC 未同步更新,BIOS 会读取旧资源图导致新硬件无法识别。
解决方法为清除 iDRAC 中的旧硬件配置,强制重新生成资源图:
-
启用 Lifecycle Controller:
- 开机按
F2进入iDRAC Settings。 - 选择
Lifecycle Controller->Enabled。 - 保存设置并退出 (
Back->Finish->Yes to save the settings and exit)。
- 开机按
-
执行硬件回滚:

