一种集群节点状态监控方法、装置、设备及可读存储介质制造方法及图纸

技术编号:24352819 阅读:25 留言:0更新日期:2020-06-03 01:56
本发明专利技术公开了一种集群节点状态监控方法,包括:获取并存储本地节点组内各个节点的节点状态信息;获取并存储各个相邻监控节点发送的第一节点状态信息;将已存储的第二节点状态信息发送给相邻监控节点;其中,第二节点状态信息包括第一节点状态信息和本地节点组内各个节点的节点状态信息;当接收到查询请求时,利用第二节点状态信息响应查询请求;该方法利用多个监控节点来获取集群中的各个节点组中各个节点的节点状态信息,通过数据交换,掌控整个集群中所有节点的节点状态信息,并稳定向外提供服务;此外,本发明专利技术还提供了一种集群节点状态监控装置、设备及计算机可读存储介质,同样具有上述有益效果。

A method, device, device and readable storage medium for monitoring the status of cluster nodes

【技术实现步骤摘要】
一种集群节点状态监控方法、装置、设备及可读存储介质
本专利技术涉及计算机集群
,特别涉及一种集群节点状态监控方法、集群节点状态监控装置、集群节点状态监控设备及计算机可读存储介质。
技术介绍
近年来,随着信息化时代的到来,数据呈现爆炸式的增长趋势,普通的大型计算机已经无法承担计算海量数据的任务,各大互联网公司纷纷采用大规模的集群来完成数据的存储和分析,确保大规模集群的稳定运行成为重点关注的问题。为了实时了解集群的运行状况,即便及时处理故障,保证集群的稳定运行,传统集群节点监控方法利用一个运行有monitor进程的监控节点来获取集群所有节点的运行状态信息,并响应所有客户端的查询请求,即为客户端提供节点状态查询服务,为客户端提供本集群中任意节点的运行状态信息。但是随着集群的规模越来越大,采用一个监控节点来获取所有节点的运行状态信息,同时还需要相应客户端的查询请求,会使得该监控节点无法及时处理所有的信息从而导致信息积压,进而导致monitor进程崩溃或信息丢失等问题。因此,传统集群节点监控方法无法稳定地收集各个节点的状态信息,也无法稳定地向外提供节点状态查询服务。因此,如何解决传统集群节点监控方法无法稳定地收集各个节点的状态信息,无法稳定地向外提供节点状态查询服务的问题,是本领域技术人员需要解决的技术问题。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种集群节点状态监控方法、集群节点状态监控装置、集群节点状态监控设备及计算机可读存储介质,解决了现传统集群节点监控方法无法稳定地收集各个节点的状态信息,无法稳定地向外提供节点状态查询服务的问题。为解决上述技术问题,本专利技术提供了一种集群节点状态监控方法,包括:获取并存储本地节点组内各个节点的节点状态信息;获取并存储各个相邻监控节点发送的第一节点状态信息;将已存储的第二节点状态信息发送给所述相邻监控节点;其中,所述第二节点状态信息包括所述第一节点状态信息和所述本地节点组内各个所述节点的所述节点状态信息;当接收到查询请求时,利用所述第二节点状态信息响应所述查询请求。可选的,还包括:判断第一时长是否大于预设时长;其中,所述第一时长为未接收到目标相邻监控节点发送的所述第一节点状态信息的时长;若是,则确定所述目标相邻监控节点发生故障,并上报故障信息。可选的,在所述上报故障信息之后,还包括:与和所述目标相邻监控节点对应的备用监控节点建立连接;向所述备用监控节点发送所述第二节点状态信息。可选的,所述节点状态信息的构建方法,包括:获取各个所述节点的CPU使用率、内存使用率、网卡速率和磁盘IO;按照信息封装规则将所述CPU使用率、所述内存使用率、所述网卡速率和所述磁盘IO封装为所述节点状态信息。本专利技术还提供了一种集群节点状态监控装置,包括:第一获取模块,用于获取并存储本地节点组内各个节点的节点状态信息;第二获取模块,用于获取并存储各个相邻监控节点发送的第一节点状态信息;发送模块,用于将已存储的第二节点状态信息发送给所述相邻监控节点;其中,所述第二节点状态信息包括所述第一节点状态信息和所述本地节点组内各个所述节点的所述节点状态信息;响应模块,用于当接收到查询请求时,利用所述第二节点状态信息响应所述查询请求。可选的,还包括:判断模块,用于判断第一时长是否大于预设时长;其中,所述第一时长为未接收到目标相邻监控节点发送的所述第一节点状态信息的时长;故障上报模块,用于若所述第一时长大于所述预设时长,则确定所述目标相邻监控节点发生故障,并上报故障信息。可选的,还包括:连接模块,用于与和所述目标相邻监控节点对应的备用监控节点建立连接;信息发送模块,用于向所述备用监控节点发送所述第二节点状态信息。可选的,包括:信息获取模块,用于获取各个所述节点的CPU使用率、内存使用率、网卡速率和磁盘IO;信息封装模块,用于按照信息封装规则将所述CPU使用率、所述内存使用率、所述网卡速率和所述磁盘IO封装为所述节点状态信息。本专利技术还提供了一种集群节点状态监控设备,包括存储器和处理器,其中:所述存储器,用于保存计算机程序;所述处理器,用于执行所述计算机程序,以实现上述的集群节点状态监控方法。本专利技术还提供了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述的集群节点状态监控方法。本专利技术提供的集群节点状态监控方法,获取并存储本地节点组内各个节点的节点状态信息。获取并存储相邻监控节点发送的第一节点状态信息;。将已存储的第二节点状态信息发送给相邻监控节点;其中,第二节点状态信息包括第一节点状态信息和本地节点组内各个节点的节点状态信息。当接收到查询请求时,利用第二节点状态信息响应查询请求。可见,该方法获取本地节点组内的节点状态信息和相邻监控节点发送的第一节点状态信息,并将自身已存储的第二节点状态信息发送给相邻监控节点。利用多个监控节点来获取集群中的各个节点组中各个节点的节点状态信息,因此监控节点的负载压力较小,可以稳定地收集节点状态信息。获取相邻监控节点发送的第一节点状态信息并将第二节点状态信息发送给相邻监控节点以进行数据交换,进而各个监控节点均可以掌控整个集群中所有节点的节点状态信息,在接收到查询请求后利用第二节点状态信息响应查询请求,稳定地向外提供节点状态查询服务。解决了传统集群节点监控方法无法稳定地收集各个节点的状态信息,无法稳定地向外提供节点状态查询服务的问题。此外,本专利技术还提供了一种集群节点状态监控装置、集群节点状态监控设备及计算机可读存储介质,同样具有上述有益效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种集群节点状态监控方法流程图;图2为本专利技术实施例提供的一种相邻监控节点故障判断方法流程图;图3为本专利技术实施例提供的一种集群节点状态监控装置的结构示意图;图4为本专利技术实施例提供的一种集群节点状态监控设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1为本专利技术实施例提供的一种集群节点状态监控方法流程图。该方法包括:S101:获取并存储本地节点组内各个节点的节点状态信息。为了防本文档来自技高网...

【技术保护点】
1.一种集群节点状态监控方法,其特征在于,包括:/n获取并存储本地节点组内各个节点的节点状态信息;/n获取并存储各个相邻监控节点发送的第一节点状态信息;/n将已存储的第二节点状态信息发送给所述相邻监控节点;其中,所述第二节点状态信息包括所述第一节点状态信息和所述本地节点组内各个所述节点的所述节点状态信息;/n当接收到查询请求时,利用所述第二节点状态信息响应所述查询请求。/n

【技术特征摘要】
1.一种集群节点状态监控方法,其特征在于,包括:
获取并存储本地节点组内各个节点的节点状态信息;
获取并存储各个相邻监控节点发送的第一节点状态信息;
将已存储的第二节点状态信息发送给所述相邻监控节点;其中,所述第二节点状态信息包括所述第一节点状态信息和所述本地节点组内各个所述节点的所述节点状态信息;
当接收到查询请求时,利用所述第二节点状态信息响应所述查询请求。


2.根据权利要求1所述的集群节点状态监控方法,其特征在于,还包括:
判断第一时长是否大于预设时长;其中,所述第一时长为未接收到目标相邻监控节点发送的所述第一节点状态信息的时长;
若是,则确定所述目标相邻监控节点发生故障,并上报故障信息。


3.根据权利要求2所述的集群节点状态监控方法,其特征在于,在所述上报故障信息之后,还包括:
与和所述目标相邻监控节点对应的备用监控节点建立连接;
向所述备用监控节点发送所述第二节点状态信息。


4.根据权利要求1所述的集群节点状态监控方法,其特征在于,所述节点状态信息的构建方法,包括:
获取各个所述节点的CPU使用率、内存使用率、网卡速率和磁盘IO;
按照信息封装规则将所述CPU使用率、所述内存使用率、所述网卡速率和所述磁盘IO封装为所述节点状态信息。


5.一种集群节点状态监控装置,其特征在于,包括:
第一获取模块,用于获取并存储本地节点组内各个节点的节点状态信息;
第二获取模块,用于获取并存储各个相邻监控节点发送的第一节点状态信息;
发送模块,用于将已存储的第二节点状态信息发送给所述相邻监...

【专利技术属性】
技术研发人员:李兴华
申请(专利权)人:北京浪潮数据技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1