【技术实现步骤摘要】
分布式集群系统的管控方法、装置、介质和设备
[0001]本专利技术涉及分布式集群系统
,具体提供一种分布式集群系统的管控方法、系统、介质和设备。
技术介绍
[0002]分布式集群系统是将一组相互独立的服务器或计算机集中起来,实现同一业务的系统,此系统能够为用户提供高可用性的服务。在分布式集群系统中,单个服务器或计算机称为集群的节点。一般而言,在分布式集群系统中,会有一个主(Master)节点用于处理事务型操作和非事务型操作,一个或一个以上从(Slave)节点处理非事务型操作,以提升整个分布式集群系统的性能。
[0003]但是现有技术中,分布式集群系统往往存在以下问题:如果主(Master)节点发生故障,则需要手动指定新的主(Master)节点,这会对分布式集群系统服务的高可用性产生影响;另外,为了保证节点的可用性,需要以一定频率对节点进行轮询以确定节点的状态,但是频繁的轮询过程会对分布式集群系统的整体性能造成一定程度的影响。
[0004]相应地,本领域需要一种新的分布式集群系统的管控方案来解决上述问题。 ...
【技术保护点】
【技术特征摘要】
1.一种分布式集群系统的管控方法,其特征在于,所述分布式集群系统包括多个服务节点,所述管控方法包括:根据每个服务节点执行完成每个服务处理任务的时间,分别确定每个所述服务节点的检测时间间隔;根据每个所述服务节点的检测时间间隔分别检测每个所述服务节点的节点状态,确定每个所述服务节点的节点状态信息;根据所述节点状态信息,确定处于不可用状态的服务节点;判断所述处于不可用状态的服务节点是否为主节点;若所述处于不可用状态的服务节点为主节点,则从其他所述服务节点中重新选择一个服务节点作为新的主节点。2.根据权利要求1所述的分布式集群系统的管控方法,其特征在于,“根据每个服务节点执行完成每个服务处理任务的时间,分别确定每个所述服务节点的检测时间间隔”的步骤包括:针对每个服务节点,根据所述服务节点执行完成每个服务处理任务的时间,获取所述服务节点已完成的服务处理任务中每两个相邻的服务处理任务之间的时间间隔,根据所述时间间隔获取所述服务节点对应的已完成的服务处理任务的平均时间间隔;根据所述平均时间间隔确定所述服务节点的检测时间间隔。3.根据权利要求2所述的分布式集群系统的管控方法,其特征在于,“根据所述平均时间间隔确定所述服务节点的检测时间间隔”步骤包括:将所述平均时间间隔与预设的时间间隔阈值进行比较;当所述平均时间间隔小于所述时间间隔阈值时,将所述服务节点的检测时间间隔设定为预设时间间隔,其中所述预设时间间隔大于所述平均时间间隔且小于等于所述时间间隔阈值;当所述平均时间间隔大于等于所述时间间隔阈值时,将所述服务节点的检测时间间隔设定为所述平均时间间隔。4.根据权利要求1所述的分布式集群系统的管控方法,其特征在于,“从其他所述服务节点中重新选择一个服务节点作为新的主节点”的步骤包括:根据每个其他所述服务节点执行完成每个服务处理任务的时间,获取最后完成服务处理任务的服务节点,并将所述最后完成服务处理任务的服务节点设定为所述新的主节点;或者,获取每个其他所述服务节点的节点地址,并将节点地址最小的服务节点设定为所述新的主节点;并且/或者,所述管控方法还包括通过下列步骤对所述分布式集群系统中的服务节点进行初始化:依次向每个所述服务节点发送服务请求,并接收每个所述服务节点根据所述服务请求各自反馈的服务返回信息;依据接收到每个所述服务返回信息的时间,将最早接收到的服务返回信息对应的服务节点设置为主节点,并将其他服务节点设置为从节点,以完成对所述分布式集群系统中服务节点的初始化;并且/或者,所述管控方法还包括:
针对每个处于不可用状态的服务节点,定时重启所述处于不可用状态的服务节点;若所述处于不可用状态的服务节点重启成功,将所述服务节点设置为从节点;其中,定时重启所述处于不可用状态的服务节点的停止条件包括:所述处于不可用状态的服务节点重启成功或重启次数超过预设的次数阈值。5.一种分布式集群系统的管控装置,其特征在于,所述分布式集群系统包括多个服务节点,所述管控装置包括:检测时间间隔确定模块,其被配置为根据每个服务节点执行完成每个服务处理任务的时间,分别确定每个所述服务节点的检测时间间隔;节点状态信息确定模块,其被配置为根据每个所述服务节点的检测时间间隔分别检测每个所述服务节点的节点状态,确...
【专利技术属性】
技术研发人员:朱鼎,杨世成,张松,
申请(专利权)人:广州云从凯风科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。