一种分布式集群的主节点故障的切换方法、系统及介质技术方案

技术编号:29411558 阅读:9 留言:0更新日期:2021-07-23 22:52
本发明专利技术公开了一种分布式集群的主节点故障的切换方法,包括以下步骤:在分布式集群内配置第一主节点及若干从节点;在所述第一主节点及所述从节点内均配置管理模块及业务模块;所述第一主节点发送组播报文至若干所述从节点;所述第一主节点接收若干所述从节点的所述组播报文的响应信息,并根据响应情况执行判定操作,通过上述方式,本发明专利技术能够实现不增加固件的情况下,在管理节点出现故障时,执行管理节点的切换,同时管理网络与业务网络相互隔离,不需要占用业务网络的通道,而且可以轮询检查是否有从节点出现异常,并执行报警操作。

【技术实现步骤摘要】
一种分布式集群的主节点故障的切换方法、系统及介质
本专利技术涉及分布式存储
,特别是涉及一种分布式集群的主节点故障的切换方法、系统及介质。
技术介绍
在分布式中心化集群中,管理节点是整个分布式集群核心,管理节点的故障可能导致集群管理功能瘫痪,所以如何在管理节点出现故障后实现切换是亟待解决的问题。现有技术中,第一种解决方法为,系统设置主管理节点以及备用管理节点,通过主管理节点的CPU与数据节点的CPU进行心跳检测,当检测到心跳异常,判断主管理节点出现异常,将备用管理节点替换主管理节点;第二种解决方法为,配置备份硬件,通过管理节点或者管理控制器实现主管理节点与备用管理节点的数据热备份,实现系统的管理功能切换。上述第一种方法,管理通道与业务通道耦合,造成管理数据处理延迟,或者占用相同的网络,造成网络数据的拥塞,导致管理数据和业务数据相互干扰;上述第二种方法,在管理节点内配置独立的硬件,使得管理系统的复杂度加大,而且热备份进行切换管理节点,需要搭配相应的软件管理方法,使得分布式集群整体开发复杂度上升。
技术实现思路
本专利技术主要解决的是管理节点发生故障时,管理节点功能切换的问题。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种分布式集群的主节点故障的切换方法,包括以下步骤:在分布式集群内配置第一主节点及若干从节点;在所述第一主节点及所述从节点内均配置管理模块及业务模块;所述第一主节点发送组播报文至若干所述从节点;所述第一主节点接收若干所述从节点的所述组播报文的响应信息,并根据响应情况执行判定操作。进一步,所述在所述第一主节点及所述从节点内均配置管理模块及业务模块的步骤进一步包括:所述管理模块含有基础信息及关键信息,所述关键信息包括固定信息及动态信息,所述固定信息存储于所述第一主节点及所述从节点,所述动态信息存储于所述第一主节点。进一步,所述在所述第一主节点及所述从节点内均配置管理模块及业务模块的步骤进一步还包括:若干所述业务模块构成业务网络,若干所述管理模块使用与所述业务模块不同的网口构成管理网络。进一步,所述第一主节点发送组播报文至若干所述从节点的步骤进一步包括:所述第一主节点通过所述管理网络周期发送组播报文至所述从节点。进一步,所述所述第一主节点接收若干所述从节点的所述组播报文的响应信息,并根据响应情况执行升主操作的步骤进一步包括:若所述第一主节点在单位时间内接收到所有所述从节点的响应信息,则判定所述管理网络内若干所述从节点状态正常;若所述第一主节点在所述单位时间内接收到部分所述从节点的响应信息,则所述第一主节点通过所述业务网络将未返回响应信息的从节点显示;若所述第一主节点在所述单位时间内未接收到所述从节点的响应信息,则执行所述升主操作。进一步,所述若所述第一主节点在所述单位时间内未接收到所述从节点的响应信息,则执行所述升主操作的步骤进一步包括:选择所述从节点作为第二主节点;所述第二主节点通过所述管理网络下发升主指令至所述第一主节点;所述第一主节点接收所述升主指令并释放管理权限,降级为所述从节点;所述第二主节点备份所述第一主节点的所述动态信息至所述管理模块。进一步,所述第二主节点备份所述第一主节点的所述动态信息至所述管理模块的步骤进一步包括:所述第二主节点刷新所述动态信息,并与所述第一主节点的动态信息对比,所述第二主节点通过所述管理网络发送组播报文,若所述第一主节点并未返回响应信息,则判定所述第一主节点的所述管理模块的管理接口发生异常,所述第二主节点通过所述业务网络执行警示操作。进一步,所述管理网络内的所述第一主节点及所述从节点的IP为外显虚拟IP。本专利技术还提供一种分布式集群的主节点故障的切换系统,应用于分布式服务器集群,所述系统包括:管理模块、业务模块及升主模块;所述管理模块用于存储关键信息及基础信息,所述管理模块还用于构成管理网络;所述业务模块用于构成业务网络,且与管理模块使用不同的网口;所述升主模块用于执行升主操作;所述分布式服务器集群内配置有管理节点及若干从节点,所述管理节点通过所述管理网络发送所述组播报文至所述从节点,若所述管理节点未接收到所述从节点的组播报文的响应信息,则开始升主操作。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现所述的分布式集群的主节点故障的切换方法步骤。本专利技术的有益效果是:1、本专利技术所述的分布式集群的主节点故障的切换方法,可以实现不增加固件的情况下,在管理节点出现故障时,执行管理节点的切换,同时管理网络与业务网络相互隔离,不需要占用业务网络的通道,而且可以轮询检查是否有从节点出现异常,并执行报警操作。2、本专利技术所述的分布式集群的主节点故障的切换系统,可以实现管理网络与业务网络相互隔离,不需要占用业务网络的通道,并在管理节点出现异常时执行升主操作。3、本专利技术所述的分布式集群的主节点故障的切换介质,可以实现轮询检测是否有从节点出现异常,当出现异常时,将异常的从节点进行显示,并且,可以在管理网络中,将网口的IP进行虚拟化操作。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例1所述的分布式集群的主节点故障的切换方法的示意图;图2是本专利技术实施例1所述的分布式集群的主节点故障的切换方法的异常判断流程图;图3是本专利技术实施例1所述的分布式集群的主节点故障的切换方法的升主流程图;图4是本专利技术实施例2所述的主节点故障的切换系统的示意图。具体实施方式下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本专利技术的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。实施例1本专利技术一种分布式集群的主节点故障的切换方法,请参阅图1,包括以下步骤:S100、在分布式集群中的每一个节点内部配置管理模块,在分布式集群内,选取物理位置最低位号的节点作为主管理节点,此实施例中选取物理位置最低的节点作为主管理节点,只是在切换节点时更加便于说明,当然,同样的原理,也可以设定本文档来自技高网...

【技术保护点】
1.一种分布式集群的主节点故障的切换方法,其特征在于,包括以下步骤:/n在分布式集群内配置第一主节点及若干从节点;/n在所述第一主节点及所述从节点内均配置管理模块及业务模块;/n所述第一主节点发送组播报文至若干所述从节点;/n所述第一主节点接收若干所述从节点的所述组播报文的响应信息,并根据响应情况执行判定操作。/n

【技术特征摘要】
1.一种分布式集群的主节点故障的切换方法,其特征在于,包括以下步骤:
在分布式集群内配置第一主节点及若干从节点;
在所述第一主节点及所述从节点内均配置管理模块及业务模块;
所述第一主节点发送组播报文至若干所述从节点;
所述第一主节点接收若干所述从节点的所述组播报文的响应信息,并根据响应情况执行判定操作。


2.根据权利要求1所述的分布式集群的主节点故障的切换方法,其特征在于:所述在所述第一主节点及所述从节点内均配置管理模块及业务模块的步骤进一步包括:所述管理模块含有基础信息及关键信息,所述关键信息包括固定信息及动态信息,所述固定信息存储于所述第一主节点及所述从节点,所述动态信息存储于所述第一主节点。


3.根据权利要求2所述的分布式集群的主节点故障的切换方法,其特征在于:所述在所述第一主节点及所述从节点内均配置管理模块及业务模块的步骤进一步还包括:若干所述业务模块构成业务网络,若干所述管理模块使用与所述业务模块不同的网口构成管理网络。


4.根据权利要求3所述的分布式集群的主节点故障的切换方法,其特征在于:所述第一主节点发送组播报文至若干所述从节点的步骤进一步包括:所述第一主节点通过所述管理网络按周期发送组播报文至所述从节点。


5.根据权利要求3所述的分布式集群的主节点故障的切换方法,其特征在于:所述第一主节点接收若干所述从节点的所述组播报文的响应信息,并根据响应情况执行判定操作的步骤进一步包括:
若所述第一主节点在单位时间内接收到所有所述从节点的响应信息,则判定所述管理网络内若干所述从节点状态正常;
若所述第一主节点在所述单位时间内接收到部分所述从节点的响应信息,则所述第一主节点通过所述业务网络将未返回响应信息的从节点显示;
若所述第一主节点在所述单位时间内未接收到所述从节点的响应信息,则执行升主操作。


6.根据...

【专利技术属性】
技术研发人员:倪志杰
申请(专利权)人:山东英信计算机技术有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1