一种节点处理方法、装置及电子设备制造方法及图纸

技术编号:21832215 阅读:14 留言:0更新日期:2019-08-10 17:50
本申请实施例提供一种节点处理方法、装置及电子设备,高可用集群中的第一节点通过本地是否查看到第二节点当前的节点状态信息即可确定第二节点是否出现问题,进而在确认第二节点出现问题时远程控制第二节点进行重启,以尝试将第二节点恢复。通过上述实现过程,在高可用集群某一节点出现问题时,其余节点即可通过对该节点的节点状态信息的实时获取情况快速定位出该节点出现了问题,进而即可迅速做出反应,远程控制该节点进行重启,这就使得高可用集群具有了快速对问题节点进行处理的功能,可以在一定程度上解决问题节点所产生的问题,保证高可用集群的可靠性和对业务处理的有效性。

A Node Processing Method, Device and Electronic Equipment

【技术实现步骤摘要】
一种节点处理方法、装置及电子设备
本申请涉及集群
,具体而言,涉及一种节点处理方法、装置及电子设备。
技术介绍
随着互联网的快速发展,用户的业务量的不断增加,对业务的可靠性和性能要求越来越高。为满足用户的需求,在实际的应用环境中往往会采用HA(HighAvailability,高可用)集群来实现业务的处理。在高可用集群中,需要各节点之间协同一致来保证集群对业务处理的有效性。如果集群中某个节点出现问题,就会影响到整个集群的工作性能,因此需要集群具有能够快速对问题节点进行处理的功能,从而保证集群的可靠性和对业务处理的有效性。
技术实现思路
本申请实施例的目的在于提供一种节点处理方法、装置及电子设备,用以使得高可用集群具有能够快速对问题节点进行处理的功能,从而在一定程度上保证高可用集群的可靠性和对业务处理的有效性。本申请实施例提供了一种节点处理方法,应用于高可用集群中;所述高可用集群包括第一节点和除所述第一节点外的其余节点,所述节点处理方法包括:第一节点实时获取所述其余节点当前的节点状态信息;所述第一节点在本地未查看到第二节点当前的节点状态信息时,确定所述第二节点是否满足预设重启条件;所述第二节点为所述其余节点中的任一节点;在所述第二节点满足预设重启条件时,所述第一节点远程控制所述第二节点进行重启。在上述实现过程中,第一节点通过实时获取其余节点当前的节点状态信息,进而在本地未查看到第二节点当前的节点状态信息时,确定第二节点是否满足预设重启条件,进而在第二节点满足预设重启条件时远程控制第二节点进行重启。这样,第一节点通过本地是否查看到第二节点当前的节点状态信息即可确定第二节点是否出现问题,进而在确认第二节点出现问题时远程控制第二节点进行重启,以尝试将第二节点恢复。通过上述实现过程,在高可用集群某一节点出现问题时,其余节点即可通过对该节点的节点状态信息的实时获取情况快速定位出该节点出现了问题,进而即可迅速做出反应,远程控制该节点进行重启,这就使得高可用集群具有了快速对问题节点进行处理的功能,可以在一定程度上解决问题节点所产生的问题,保证高可用集群的可靠性和对业务处理的有效性。进一步地,所述所述第一节点在本地未查看到第二节点当前的节点状态信息时,确定所述第二节点是否满足预设重启条件包括:所述第一节点在本地未查看到第二节点当前的节点状态信息时,获取所述高可用集群中第三节点对所述第二节点的查看情况;在所述第三节点对所述第二节点的查看情况为未查看到时,确定所述第二节点满足预设重启条件;所述第三节点为所述其余节点中除所述第二节点外的节点;否则,确定所述第二节点不满足预设重启条件。在上述实现过程中,第一节点在本地未查看到第二节点当前的节点状态信息时,进一步获取高可用集群中第三节点对第二节点的查看情况,在第三节点对第二节点的查看情况为也未查看到,且集群内也没有哪一个节点对第二节点进行了处理时,第一节点才远程控制所述第二节点进行重启。这就使得对于第二节点是否为问题节点的确定,需要由集群内除该第二节点外的节点来共同确认,保证了对问题节点的确认准确性,避免误判。进一步地,在所述第一节点远程控制所述第二节点进行重启之前,还包括:确定所述第一节点未接收到对所述第二节点的已处理通知;所述已处理通知用于通知所述第一节点已远程控制所述第二节点进行重启。在上述实现过程中,在高可用集群中没有节点对第二节点进行处理时,第一节点才远程控制第二节点进行重启,这就避免了在高可用集群中不同节点对第二节点进行重复处理的情况,节约了高可用集群的资源,同时也提高了对第二节点的处理有效性。进一步地,所述第一节点实时获取所述其余节点当前的节点状态信息还包括:所述第一节点实时获取所述其余节点当前的节点状态信息并保存至所述第一节点内预设的内存数据库或分布式内存集群中。在上述实现过程中,通过内存数据库或分布式内存集群来实现对其余节点当前的节点状态信息的存储。这样就提高了数据读写速度,使得在负载较高的情况下也可以有很好的数据读写性能,从而使得第一节点在负载较高的情况下也可以很好的实现对获取到的当前的节点状态信息的查看,降低了在负载较高的情况下对问题节点的误判概率。进一步地,所述节点处理方法还包括:所述第一节点将自身当前的节点状态信息同步给所述其余节点。在上述实现过程中,节点在内存数据库或分布式内存集群中也存储自身当前的节点状态信息,同时将自身当前的节点状态信息同步给其余节点,从而保证了高可用集群内各节点的节点状态信息得以实时同步。进一步地,所述节点处理方法还包括:在所述第一节点接到关机或重启指令时,所述第一节点将所述预设的内存数据库或分布式内存集群中的数据迁移至预设磁盘中,并在数据迁移完毕之后启动关机程序进行关机;在所述第一节点在所述关机或重启的状态下开机后,所述第一节点将所述预设磁盘中由所述预设的内存数据库或分布式内存集群中迁移来的数据迁移回所述预设的内存数据库或分布式内存集群中。应当理解,在实际应用过程中,内存中的数据在关机时具有数据丢失的风险。在上述实现过程中,通过在接收到关机或重启指令时自动进行数据迁移,将内存中的数据迁移至磁盘中,并在开机后自动将迁至磁盘中的数据迁回内存中,即有效降低了数据丢失的风险,保证了数据的安全性。进一步地,在所述第一节点远程控制所述第二节点进行重启之前,还包括:所述第一节点获取所述第二节点在预设时长内的重启次数,在所述重启次数大于预设次数阈值时,远程控制所述第二节点进行关机。在实际应用过程中,节点有可能是由于硬件故障等情况导致节点出现问题,此时通过重启是无法解决该节点的问题的。在上述实现过程中,如果一个节点在预设时长内的重启次数大于预设次数阈值,即可认为该节点的问题是通过重启无法解决的,此时将该节点进行关机处理,以避免其对高可用集群造成更多的影响。进一步地,在所述第一节点实时获取所述其余节点当前的节点状态信息之后,所述方法还包括:在所述第一节点未在本地查看到所述其余节点当前的节点状态信息时,所述第一节点进行重启。在上述实现过程中,第一节点如果在本地查看不到其余节点当前的节点状态信息,以尝试进行恢复,从而在一定程度上解决自身所产生的问题,保证高可用集群的可靠性和对业务处理的有效性。进一步地,所述在所述第一节点未在本地查看到所述其余节点当前的节点状态信息时,所述第一节点进行重启包括:在所述第一节点连续n秒内未在本地查看到所述其余节点当前的节点状态信息时,所述第一节点进行重启;所述n为预设的大于0的常数。应当理解是,在实际应用中,节点间可能由于网络等问题导致短暂的数据中断或延迟,从而导致节点在某个时刻没有获取到其余节点的状态信息。在上述实现过程中,第一节点通过连续n秒内的不断确认,从而在一定程度上避免了由于网络等问题导致短暂的数据中断或延迟,导致节点误判自身为问题节点的情况,提高了对自身是否为问题节点的判断的准确性。本申请实施例还提供了一种节点处理装置,应用于高可用集群中的第一节点上;所述高可用集群包括第一节点和除所述第一节点外的其余节点;所述节点处理装置包括:信息获取模块,信息查看模块、信息处理模块,远程控制模块;所述信息获取模块用于实时获取所述其余节点当前的节点状态信息;所述信息查看模块用于实时查看获取到的所述其余节点当前的本文档来自技高网...

【技术保护点】
1.一种节点处理方法,其特征在于,应用于高可用集群中;所述高可用集群包括第一节点和除所述第一节点外的其余节点,所述节点处理方法包括:第一节点实时获取所述其余节点当前的节点状态信息;所述第一节点在本地未查看到第二节点当前的节点状态信息时,确定所述第二节点是否满足预设重启条件;所述第二节点为所述其余节点中的任一节点;在所述第二节点满足预设重启条件时,所述第一节点远程控制所述第二节点进行重启。

【技术特征摘要】
1.一种节点处理方法,其特征在于,应用于高可用集群中;所述高可用集群包括第一节点和除所述第一节点外的其余节点,所述节点处理方法包括:第一节点实时获取所述其余节点当前的节点状态信息;所述第一节点在本地未查看到第二节点当前的节点状态信息时,确定所述第二节点是否满足预设重启条件;所述第二节点为所述其余节点中的任一节点;在所述第二节点满足预设重启条件时,所述第一节点远程控制所述第二节点进行重启。2.如权利要求1所述的节点处理方法,其特征在于,所述第一节点在本地未查看到第二节点当前的节点状态信息时,确定所述第二节点是否满足预设重启条件包括:所述第一节点在本地未查看到第二节点当前的节点状态信息时,获取所述高可用集群中第三节点对所述第二节点的节点状态信息的查看情况;在所述第三节点对所述第二节点的查看情况为未查看到时,确定所述第二节点满足预设重启条件;所述第三节点为所述其余节点中除所述第二节点外的节点;否则,确定所述第二节点不满足预设重启条件。3.如权利要求1所述的节点处理方法,其特征在于,在所述第一节点远程控制所述第二节点进行重启之前,还包括:确定所述第一节点未接收到对所述第二节点的已处理通知;所述已处理通知用于通知所述第一节点已远程控制所述第二节点进行重启。4.如权利要求1所述的节点处理方法,其特征在于,所述第一节点实时获取所述其余节点当前的节点状态信息包括:所述第一节点实时获取所述其余节点当前的节点状态信息并保存至所述第一节点内预设的内存数据库或分布式内存集群中。5.如权利要求4所述的节点处理方法,其特征在于,所述方法还包括:所述第一节点将自身当前的节点状态信息同步给所述其余节点。6.如权利要求4或5所述的节点处理方法,其特征在于,所述方法还包括:在所述第一节点接到关机或重启指令时,所述第一节点将所述预设的内存数据库或分布式内存集群中的数据迁移至预设磁盘中,并在数据迁移完毕之后启动关机程序进行关机;在所述第一节点在所述关机或重...

【专利技术属性】
技术研发人员:许广彬吴业亮谭瑞忠刘馗
申请(专利权)人:无锡华云数据技术服务有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1