加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

R5300 G4服务器升级固件后上报CPU告警

07/29 13:43
1000
阅读需 2 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

问题描述

批量升级多台R5300 G4服务器固件,包括BIOS、FRU、网卡和RAID卡版本。升级完成后,多台服务器上报告警:CPU system has a catastrophic error.

服务器信息如下:

BMC版本:03.19.0301

BIOS版本:03.22.0100

CPU型号:Intel®Xeon®Gold 5218 CPU @ 2.30GHz

适用产品:R5300 G4

解决方案

结合BMC日志分析,在mntnandflash1logsystem.log中,每次CPU重启都发生在服务器重启过程中,如下图所示。

结合BMC日志分析,在mntnandflash1loglifcycel.log中,发生CPU错误的原因是EPLD检测到0XA8寄存器值为0X22e,如下图所示。

0XA8寄存器定义参见下表,当0XA8寄存器的1 bit不为0时,表示CPU出现MSI错误。

结合MSR日志分析,在mntnandflash1hostcheckmsr中,MC_STATUS列为空,没有记录CPU的具体错误类型,如下图所示。

通过检查现场操作,发现在升级RAID卡固件和BIOS版本后,CPU信息与RAID卷组残留的配置有冲突。

根据以上检查结果,删除RAID卷组,告警消失。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
TJA1042T/3/1J 1 NXP Semiconductors TJA1042 - High-speed CAN transceiver with Standby mode SOIC 8-Pin

ECAD模型

下载ECAD模型
$1.7 查看
DP83867ISRGZT 1 Texas Instruments Industrial temperature, robust gigabit Ethernet PHY transceiver with SGMII 48-VQFN -40 to 85

ECAD模型

下载ECAD模型
$7.14 查看
KSZ8863FLLI 1 Microchip Technology Inc DATACOM, LAN SWITCHING CIRCUIT, PQFP48
$4.95 查看
中兴通讯

中兴通讯

中兴通讯股份有限公司,是全球领先的综合通信解决方案提供商,中国最大的通信设备上市公司。主要产品包括:2G/3G/4G/5G无线基站与核心网、IMS、固网接入与承载、光网络、芯片、高端路由器、智能交换机、政企网、大数据、云计算、数据中心、手机及家庭终端、智慧城市、ICT业务,以及航空、铁路与城市轨道交通信号传输设备。

中兴通讯股份有限公司,是全球领先的综合通信解决方案提供商,中国最大的通信设备上市公司。主要产品包括:2G/3G/4G/5G无线基站与核心网、IMS、固网接入与承载、光网络、芯片、高端路由器、智能交换机、政企网、大数据、云计算、数据中心、手机及家庭终端、智慧城市、ICT业务,以及航空、铁路与城市轨道交通信号传输设备。收起

查看更多

相关推荐

电子产业图谱