一种服务器故障预警方法、系统、电子设备及存储介质技术方案

技术编号:36801623 阅读:14 留言:0更新日期:2023-03-08 23:48
本发明专利技术提供一种服务器故障预警方法、系统、电子设备及存储介质,本发明专利技术属于服务器故障预警技术领域。该方法包括:通过BMC监测服务器集群,获得所述服务器集群中服务器的各个部件的状态信息;根据所述状态信息,确定存在异常的目标部件;根据所述目标部件的状态信息,通过多个预警单元同时进行与所述目标部件的状态信息对应的预警动作。旨在无网络状态下对故障服务器发出告警并方便管理人员对其快速定位,以查找故障原因。以查找故障原因。以查找故障原因。

【技术实现步骤摘要】
一种服务器故障预警方法、系统、电子设备及存储介质


[0001]本专利技术涉及服务器故障预警
,尤其涉及一种服务器故障预警方法、系统、电子设备及存储介质。

技术介绍

[0002]众所周知,服务器是整个互联网当中的“大脑”,而BMC(Baseboard Management Controller)则是服务器的助理,负责监控服务器的状态,在BMC(Baseboard Management Controller)启动时重点是对当前服务器中所安装的部件状态进行检查,并识别出有问题的部件并告警。首先考虑的是整个服务器的安全,不能因为某个部件的故障导致服务器整体的不稳定性。目前BMC(Baseboard Management Controller)的告警机制对网络需求比较严重,只能通过查看某一个页面或者snmp trap来接收网络发出的trap才能得知当前服务器出现了问题,如果在没有网络的环境下,管理人员不能及时地发现当前服务器所出现的故障,从而导致严重的后果。

技术实现思路

[0003]有鉴于此,本专利技术提供一种服务器故障预警方法、系统、电子设备及存储介质。旨在无网络状态下对故障服务器发出告警并方便管理人员对其快速定位,以查找故障原因。
[0004]在本专利技术实施例的第一方面,提供了一种服务器故障预警方法,所述方法包括:
[0005]通过BMC监测服务器集群,获得所述服务器集群中服务器的各个部件的状态信息;
[0006]根据所述状态信息,确定存在异常的目标部件;
[0007]根据所述目标部件的状态信息,通过多个预警单元同时进行与所述目标部件的状态信息对应的预警动作。
[0008]可选的,所述多个预警单元至少包括与所述服务器集群中的各个服务器分别连接的鸣笛预警单元,以及,BMC预警单元,所述BMC预警单元通过BMC页面向用户进行预警;其中,各个鸣笛预警单元通过i2c线路分别与各自对应的服务器主板连接。
[0009]可选的,所述方法还包括:
[0010]构建与BMC架构适配的BMC预警进程;
[0011]所述根据所述目标部件的状态信息,通过多个预警单元同时进行与所述目标部件的状态信息对应的预警动作,包括:根据所述目标部件的状态信息,通过所述BMC预警进程控制多个预警单元同时进行与所述目标部件的状态信息对应的预警动作。
[0012]可选的,所述根据所述目标部件的状态信息,通过所述BMC预警进程控制多个预警单元同时进行与所述目标部件的状态信息对应的预警动作,包括:
[0013]根据所述目标部件的状态信息,确定对应的预警等级;
[0014]通过所述BMC预警进程向与所述目标部件对应的服务器连接的目标鸣笛预警单元发送与所述预警等级对应的鸣笛信号,以控制所述目标鸣笛预警单元进行对应的鸣笛预警,以及,通过所述BMC预警进程控制BMC页面的页面样式切换至与所述预警等级对应的目
标样式。
[0015]可选的,所述方法还包括:
[0016]实时监测所述BMC页面所在主机的网络状态;
[0017]在所述主机处于无网络状态时,通过所述BMC页面向用户进行预警。
[0018]可选的,在BMC启动预警前,所述方法还包括:
[0019]检测所述BMC预警进程是否运行正常;
[0020]在所述BMC预警进程运行异常时,通过BMC控制BMC页面进行预警;
[0021]在所述BMC预警进程运行正常时,检测服务器集群中各个服务器与各自对应的鸣笛预警单元的i2c线路是否链通;
[0022]在服务器与自身对应的鸣笛预警单元未链通时,通过BMC预警进程控制BMC页面进行预警。
[0023]可选地,在BMC启动预警后,所述方法还包括:
[0024]在BMC页面显示目标窗口,以接收用户的控制指令;
[0025]根据用户的控制指令,创建目标部件的状态信息与预警等级之间的对应关系。
[0026]在本专利技术实施例的第二方面,提供了一种服务器故障预警系统,所述系统包括:
[0027]基板管理控制单元,用于监测服务器集群,获得所述服务器集群中服务器的各个部件的状态信息;
[0028]目标部件确定单元,用于根据所述状态信息,确定存在异常的目标部件;
[0029]预警总单元,用于根据所述目标部件的状态信息,通过多个预警单元同时进行与所述目标部件的状态信息对应的预警动作。
[0030]在本专利技术实施例的第三方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0031]存储器,用于存放计算机程序;
[0032]处理器,用于执行存储器上所存放的程序时,实现本专利技术第一方面所述的一种服务器故障预警方法的步骤。
[0033]在本专利技术实施例的第四方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术第一方面所述的一种服务器故障预警方法。
[0034]针对在先技术,本专利技术具备如下优点:
[0035]本专利技术实施例提供的一种服务器故障预警方法,通过BMC监测服务器集群,获得所述服务器集群中服务器的各个部件的状态信息;根据所述状态信息,确定存在异常的目标部件;根据所述目标部件的状态信息,通过多个预警单元同时进行与所述目标部件的状态信息对应的预警动作,该多个预警单元中包括无需网络即可对服务器故障进行预警的鸣笛预警单元。通过本专利技术的预警机制,即使在无网络状态下也可对服务器的故障进行及时预警,同时鸣笛预警单元是与每个服务器一一对应配置的,可对各个服务器的故障进行针对性预警,以便于管理人员可以快速定位到故障服务器所在位置,从而进行故障的排查与解决。
[0036]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0037]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
[0038]图1为本专利技术实施例提供的一种服务器故障预警方法的流程图;
[0039]图2为本专利技术实施例提供的一种服务器故障预警系统的示意图;
[0040]图3为本专利技术实施例提供的一种电子设备的示意图。
具体实施方式
[0041]下面将参照附图更详细地描述本专利技术的示例性实施例。
[0042]在对本专利技术进行说明之前,先对本专利技术提出的背景进行说明,目前的服务器预警机制为由BMC负责监控服务器的状态,在BMC启动时重点是对当前服务器中所安装的部件状态进行检查,并识别出有问题的部件后,将故障信息通过BMC页面的特定页面进行输出,在管理人员进入BMC页面的该特定页面时,才能查看到该故障信息。同时将故障信息在BMC页面的特定页面进行输出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务器故障预警方法,其特征在于,所述方法包括:通过BMC监测服务器集群,获得所述服务器集群中服务器的各个部件的状态信息;根据所述状态信息,确定存在异常的目标部件;根据所述目标部件的状态信息,通过多个预警单元同时进行与所述目标部件的状态信息对应的预警动作。2.根据权利要求1所述的一种服务器故障预警方法,其特征在于,所述多个预警单元至少包括与所述服务器集群中的各个服务器分别连接的鸣笛预警单元,以及,BMC预警单元,所述BMC预警单元通过BMC页面向用户进行预警;其中,各个鸣笛预警单元通过i2c线路分别与各自对应的服务器主板连接。3.根据权利要求2所述的一种服务器故障预警方法,其特征在于,所述方法还包括:构建与BMC架构适配的BMC预警进程;所述根据所述目标部件的状态信息,通过多个预警单元同时进行与所述目标部件的状态信息对应的预警动作,包括:根据所述目标部件的状态信息,通过所述BMC预警进程控制多个预警单元同时进行与所述目标部件的状态信息对应的预警动作。4.根据权利要求3所述的一种服务器故障预警方法,其特征在于,所述根据所述目标部件的状态信息,通过所述BMC预警进程控制多个预警单元同时进行与所述目标部件的状态信息对应的预警动作,包括:根据所述目标部件的状态信息,确定对应的预警等级;通过所述BMC预警进程向与所述目标部件对应的服务器连接的目标鸣笛预警单元发送与所述预警等级对应的鸣笛信号,以控制所述目标鸣笛预警单元进行对应的鸣笛预警,以及,通过所述BMC预警进程控制BMC页面的页面样式切换至与所述预警等级对应的目标样式。5.根据权利要求3所述的一种服务器故障预警方法,其特征在于,所述方法还包括:实时监测所述BMC页面所在主机的网络状...

【专利技术属性】
技术研发人员:蒋森
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1