一种服务器集群故障管理的方法、装置、设备及可读介质制造方法及图纸

技术编号:34644011 阅读:25 留言:0更新日期:2022-08-24 15:20
本发明专利技术提供了一种服务器集群故障管理的方法、装置、设备及可读介质,方法包括:将集群中各个服务器使用LLDP协议连接以使各个服务器能够经由LLDP协议发送LLDP报文;在LLDP报文中的LLDPDU中设置存放服务器关键部件故障信息的数据结构;响应于服务器的关键部件发生故障,将LLDPDU中的数据结构中对应的关键部件的bit置1;待发生故障的服务器将LLDP报文发送到监控服务器进行解析以获取服务器的故障信息。通过使用本发明专利技术的方案,能够保证数据传输的安全可靠性,能实时获取各个服务器的故障信息,方便管理,能够提高用户的体验。能够提高用户的体验。能够提高用户的体验。

【技术实现步骤摘要】
一种服务器集群故障管理的方法、装置、设备及可读介质


[0001]本专利技术涉及计算机领域,并且更具体地涉及一种服务器集群故障管理的方法、装置、设备及可读介质。

技术介绍

[0002]近年来服务器的需求量激增,搭建在一个局域网的服务器集群的数量逐渐增多,随之而来的是对集群内服务器故障管理的需求,如何有效的管理以及在保证不泄露的前提下来收集信息显得格外重要。目前行业对服务器的管理从单台服务器的角度来说,有BMC这种带外管理工具,用户每次只能登录一台设备,无法做到同时查看多台设备的信息,在一些多节点的机器中,通过CMC来管理多个节点,虽然可以优化这种场景,但是管理的节点数量也屈指可数,本质上还是需要去访问单个设备。

技术实现思路

[0003]有鉴于此,本专利技术实施例的目的在于提出一种服务器集群故障管理的方法、装置、设备及可读介质,通过使用本专利技术的技术方案,能够保证数据传输的安全可靠性,能实时获取各个服务器的故障信息,方便管理,能够提高用户的体验。
[0004]基于上述目的,本专利技术的实施例的一个方面提供了一种服务器集群故障管理的方法,包括以下步骤:
[0005]将集群中各个服务器使用LLDP协议连接以使各个服务器能够经由LLDP协议发送LLDP报文;
[0006]在LLDP报文中的LLDPDU中设置存放服务器关键部件故障信息的数据结构;
[0007]响应于服务器的关键部件发生故障,将LLDPDU中的数据结构中对应的关键部件的bit置1;
[0008]待发生故障的服务器将LLDP报文发送到监控服务器进行解析以获取服务器的故障信息。
[0009]根据本专利技术的一个实施例,集群中各个服务器采用DHCP动态获取IP地址且将LLDP协议的工作模式设置为TX,监控服务器使用静态IP且将LLDP协议的工作模式设置为RX。
[0010]根据本专利技术的一个实施例,在LLDP报文中的LLDPDU中设置存放服务器关键部件故障信息的数据结构包括:
[0011]LLDPDU中的数据结构包括ChassisID、PortID、Time To Live、和Optional data,其中Optional data中存放关键部件的告警信息,每个信息占两个字节。
[0012]根据本专利技术的一个实施例,待发生故障的服务器将LLDP报文发送到监控服务器进行解析以获取服务器的故障信息包括:
[0013]监控服务器构建服务器部件故障表结构;
[0014]响应于监控服务器接收到LLDP报文,获取LLDP报文中的Hostname、MAC地址和LLDPDU的信息;
[0015]将Hostname与MAC结合作为设备的标识存储到表结构中,并将LLDPDU中的关键部件告警信息存储到表结构中的相应位置。
[0016]本专利技术的实施例的另一个方面,还提供了一种服务器集群故障管理的装置,装置包括:
[0017]连接模块,连接模块配置为将集群中各个服务器使用LLDP协议连接以使各个服务器能够经由LLDP协议发送LLDP报文;
[0018]设置模块,设置模块配置为在LLDP报文中的LLDPDU中设置存放服务器关键部件故障信息的数据结构;
[0019]置位模块,置位模块配置为响应于服务器的关键部件发生故障,将LLDPDU中的数据结构中对应的关键部件的bit置1;
[0020]解析模块,解析模块配置为待发生故障的服务器将LLDP报文发送到监控服务器进行解析以获取服务器的故障信息。
[0021]根据本专利技术的一个实施例,集群中各个服务器采用DHCP动态获取IP地址且将LLDP协议的工作模式设置为TX,监控服务器使用静态IP且将LLDP协议的工作模式设置为RX。
[0022]根据本专利技术的一个实施例,设置模块还配置为:
[0023]LLDPDU中的数据结构包括ChassisID、PortID、Time To Live、和Optional data,其中Optional data中存放关键部件的告警信息,每个信息占两个字节。
[0024]根据本专利技术的一个实施例,解析模块还配置为:
[0025]监控服务器构建服务器部件故障表结构;
[0026]响应于监控服务器接收到LLDP报文,获取LLDP报文中的Hostname、MAC地址和LLDPDU的信息;
[0027]将Hostname与MAC结合作为设备的标识存储到表结构中,并将LLDPDU中的关键部件告警信息存储到表结构中的相应位置。
[0028]本专利技术的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:
[0029]至少一个处理器;以及
[0030]存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
[0031]本专利技术的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
[0032]本专利技术具有以下有益技术效果:本专利技术实施例提供的服务器集群故障管理的方法,通过将集群中各个服务器使用LLDP协议连接以使各个服务器能够经由LLDP协议发送LLDP报文;在LLDP报文中的LLDPDU中设置存放服务器关键部件故障信息的数据结构;响应于服务器的关键部件发生故障,将LLDPDU中的数据结构中对应的关键部件的bit置1;待发生故障的服务器将LLDP报文发送到监控服务器进行解析以获取服务器的故障信息的技术方案,能够保证数据传输的安全可靠性,能实时获取各个服务器的故障信息,方便管理,能够提高用户的体验。
附图说明
[0033]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0034]图1为根据本专利技术一个实施例的服务器集群故障管理的方法的示意性流程图;
[0035]图2为根据本专利技术一个实施例的服务器集群故障管理的装置的示意图;
[0036]图3为根据本专利技术一个实施例的计算机设备的示意图;
[0037]图4为根据本专利技术一个实施例的计算机可读存储介质的示意图。
具体实施方式
[0038]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。
[0039]基于上述目的,本专利技术的实施例的第一个方面,提出了一种服务器集群故障管理的方法的一个实施例。图1示出的是该方法的示意性流程图。
[0040]如图1中所示,该方法可以包括以下步骤:
[0041]S1将集群中各个服务器使用LLDP协议连接以使各个服务器能够经由LLDP协议发送LLDP报文。LLDP协议是一种链路层管理协议,使得接入网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务器集群故障管理的方法,其特征在于,包括以下步骤:将集群中各个服务器使用LLDP协议连接以使各个服务器能够经由LLDP协议发送LLDP报文;在LLDP报文中的LLDPDU中设置存放服务器关键部件故障信息的数据结构;响应于服务器的关键部件发生故障,将LLDPDU中的数据结构中对应的关键部件的bit置1;待发生故障的服务器将LLDP报文发送到监控服务器进行解析以获取服务器的故障信息。2.根据权利要求1所述的方法,其特征在于,集群中各个服务器采用DHCP动态获取IP地址且将LLDP协议的工作模式设置为TX,监控服务器使用静态IP且将LLDP协议的工作模式设置为RX。3.根据权利要求1所述的方法,其特征在于,在LLDP报文中的LLDPDU中设置存放服务器关键部件故障信息的数据结构包括:LLDPDU中的数据结构包括ChassisID、PortID、Time To Live、和Optional data,其中Optional data中存放关键部件的告警信息,每个信息占两个字节。4.根据权利要求1所述的方法,其特征在于,待发生故障的服务器将LLDP报文发送到监控服务器进行解析以获取服务器的故障信息包括:监控服务器构建服务器部件故障表结构;响应于监控服务器接收到LLDP报文,获取LLDP报文中的Hostname、MAC地址和LLDPDU的信息;将Hostname与MAC结合作为设备的标识存储到表结构中,并将LLDPDU中的关键部件告警信息存储到表结构中的相应位置。5.一种服务器集群故障管理的装置,其特征在于,所述装置包括:连接模块,所述连接模块配置为将集群中各个服务器使用LLDP协议连接以使各个服务器能够经由LLDP协议发送LLDP报文;设置模块,所述设置模块配置为...

【专利技术属性】
技术研发人员:徐志敏
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1