一种中央处理器状态监测方法、装置、设备、存储介质制造方法及图纸

技术编号:33957254 阅读:20 留言:0更新日期:2022-06-29 23:49
本申请公开了一种中央处理器状态监测方法、装置、设备、存储介质,包括:通过预先与中央处理器建立通信连接的专用单线型总线,读取中央处理器内部的预设寄存器中记录的中央处理器的当前状态信息,并在本地保存当前状态信息;判断当前状态信息和本地保存的中央处理器的上一状态信息之间是否一致;如果当前状态信息和上一状态信息之间不一致,则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。通过本申请能够获取精确的中央处理器的当前状态信息并及时上报告知管理员,有利于维持中央处理器良好的使用性能和延长使用寿命,同时尽量避免了因中央处理器高温导致的服务器宕机等问题,能够有效防止告警误解除的情况发生。误解除的情况发生。误解除的情况发生。

【技术实现步骤摘要】
一种中央处理器状态监测方法、装置、设备、存储介质


[0001]本专利技术涉及服务器管理软件
,特别涉及一种中央处理器状态监测方法、装置、设备、存储介质。

技术介绍

[0002]当前,CPU(Central Processing Unit,中央处理器)作为服务器系统的运算和控制的核心部件,在使用过程中需要对CPU的状态进行监测,防止出现CPU Prochot或CPU Error。CPU Prochot信号会在CPU温度达到预设高温阈值时触发。
[0003]目前,在EGS(Eagle Stream)平台,由于CPU Prochot管脚被设计为单向输入管脚,CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件)只能获取VR(Voltage Regulator,电压调节器)芯片检测的CPU附近环境温度、进而根据CPU附近环境温度情况决定是否触发CPU Prochot信号。因此,由于VR芯片检测到CPU附近环境温度迟滞于CPU核心温度,使得BMC(Baseboard Management Controller,基板管理控制器)无法及时通过CPLD获取CPU Prochot状态并及时触发告警。
[0004]综上,如何实现准确的中央处理器状态监测,并能准确的实现异常状态告警,有利于运维人员及时调整散热策略或排查故障,是本领域有待解决的问题。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种中央处理器状态监测方法、装置、设备、存储介质,能够准确的中央处理器状态监测,并能准确的实现异常状态告警,有利于运维人员及时调整散热策略或排查故障。其具体方案如下:
[0006]第一方面,本申请公开了一种一种中央处理器状态监测方法,应用于基板管理控制器,包括:
[0007]通过预先与中央处理器建立通信连接的专用单线型总线,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前状态信息,并在本地保存所述当前状态信息;
[0008]判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致;
[0009]如果所述当前状态信息和所述上一状态信息之间不一致,则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。
[0010]可选的,所述通过预先与中央处理器建立通信连接的专用单线型总线,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前状态信息,并在本地保存所述当前状态信息,包括:
[0011]通过预先与中央处理器建立通信连接的平台环境式控制接口,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前温度状态信息,并在本地保存所述当前温度状态信息。
[0012]可选的,所述判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致,包括:
[0013]如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息一致,则不进行相应的异常状态告警或者解除异常状态告警,并重新跳转至执行所述通过预先与中央处理器建立通信连接的平台环境式控制接口,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前温度状态信息,并在本地保存所述当前温度状态信息的步骤。
[0014]可选的,所述如果所述当前状态信息和本地保存的所述中央处理器的上一状态信息不一致,则根据预设的异常状态告警规则进行相应的异常状态告警,包括:
[0015]如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息不一致,且所述当前温度状态信息为温度异常状态信息,则触发温度状态异常上报指令,并通过基板管理控制器记录温度异常状态产生的告警日志并进行相应的温度异常状态告警。
[0016]可选的,所述如果所述当前状态信息和本地保存的所述中央处理器的上一状态信息不一致,则根据预设的异常状态告警规则进行相应的解除异常状态告警,包括:
[0017]检测并记录每一次中央处理器处于温度异常状态时服务器的系统时间;
[0018]如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息不一致,且所述当前温度状态信息为温度正常状态信息,则计算当前服务器的系统时间与所述中央处理器的上一温度异常状态信息时服务器的系统时间的时间差;
[0019]根据所述时间差以及电压调节器内置的温度传感器检测的所述中央处理器温度状态信息选择是否解除异常状态告警。
[0020]可选的,所述根据所述时间差以及电压调节器内置的温度传感器检测的所述中央处理器温度状态信息选择是否解除异常状态告警,包括:
[0021]当所述时间差小于预设时间差,则不进行解除异常状态告警的操作,并重新跳转至执行所述通过预先与中央处理器建立通信连接的平台环境式控制接口,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前温度状态信息,并在本地保存所述当前温度状态信息的步骤。
[0022]可选的,所述根据所述时间差以及电压调节器内置的温度传感器检测的所述中央处理器温度状态信息选择是否解除异常状态告警,包括:
[0023]如果所述时间差大于预设时间差,并且电压调节器内置的温度传感器检测到的所述中央处理器温度状态信息为温度正常状态信息,则通过基板管理控制器记录温度正常状态产生的日志并解除异常状态告警。
[0024]第二方面,本申请公开了一种中央处理器状态监测装置,包括:
[0025]信息读取模块,用于通过预先与中央处理器建立通信连接的专用单线型总线,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前状态信息,并在本地保存所述当前状态信息;
[0026]信息判断模块,用于判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致;
[0027]状态监测模块,用于如果所述当前状态信息和所述上一状态信息之间不一致,则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。
[0028]第三方面,本申请公开了一种电子设备,包括:
[0029]存储器,用于保存计算机程序;
[0030]处理器,用于执行所述计算机程序,以实现如前述公开的中央处理器状态监测方法的步骤。
[0031]第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如前述公开的中央处理器状态监测方法的步骤。
[0032]可见,本申请公开了一种中央处理器状态监测方法,应用于基板管理控制器,包括:通过预先与中央处理器建立通信连接的专用单线型总线,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前状态信息,并在本地保存所述当前状态信息;判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致;如果所述当前状态信息和所述上一状态信息之间不一致,则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。由此可见,本申请通过预先与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种中央处理器状态监测方法,其特征在于,应用于基板管理控制器,包括:通过预先与中央处理器建立通信连接的专用单线型总线,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前状态信息,并在本地保存所述当前状态信息;判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致;如果所述当前状态信息和所述上一状态信息之间不一致,则根据预设的异常状态告警规则进行相应的异常状态告警或者解除异常状态告警。2.根据权利要求1所述的中央处理器状态监测方法,其特征在于,所述通过预先与中央处理器建立通信连接的专用单线型总线,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前状态信息,并在本地保存所述当前状态信息,包括:通过预先与中央处理器建立通信连接的平台环境式控制接口,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前温度状态信息,并在本地保存所述当前温度状态信息。3.根据权利要求2所述的中央处理器状态监测方法,其特征在于,所述判断所述当前状态信息和本地保存的所述中央处理器的上一状态信息之间是否一致,包括:如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息一致,则不进行相应的异常状态告警或者解除异常状态告警,并重新跳转至执行所述通过预先与中央处理器建立通信连接的平台环境式控制接口,读取所述中央处理器内部的预设寄存器中记录的所述中央处理器的当前温度状态信息,并在本地保存所述当前温度状态信息的步骤。4.根据权利要求2所述的中央处理器状态监测方法,其特征在于,所述如果所述当前状态信息和本地保存的所述中央处理器的上一状态信息不一致,则根据预设的异常状态告警规则进行相应的异常状态告警,包括:如果所述当前温度状态信息和本地保存的所述中央处理器的上一温度状态信息不一致,且所述当前温度状态信息为温度异常状态信息,则触发温度状态异常上报指令,并通过基板管理控制器记录温度异常状态产生的告警日志并进行相应的温度异常状态告警。5.根据权利要求2所述的中央处理器状态监测方法,其特征在于,所述如果所述当前状态信息和本地保存的所述中央处理器的上一状态信息不一致,则根据预设的异常状态告警规则进行相应的解除异常状态告警,包括:检测并记录每一次中央处理器处于温度异...

【专利技术属性】
技术研发人员:梅飞
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1