节点服务异常处理方法、装置、设备及存储介质制造方法及图纸

技术编号:26226625 阅读:83 留言:0更新日期:2020-11-04 11:05
本申请公开了提供的节点服务异常处理方法,在节点服务异常时,首先尝试对该服务进行重启操作,若在规定的服务重启阈值次数内成功的将该服务拉起,则继续通过虚拟IP为客户端提供服务,无需重新连接,由于重启服务的执行时间要远小于虚拟IP发生迁移并与客户端重新建立连接所消耗的时间,有助于快速恢复对客户端的业务提供,最大限度的缩短客户端因为节点服务异常所等待的恢复时间;如果在规定服务重启阈值次数内仍然无法拉起服务,服务仍然异常时,为保证服务的持续运行,将为客户端提供服务的虚拟IP进行集群内部迁移,迁移至集群内部其他正常的节点。本申请还提供了一种节点服务异常处理装置、设备及一种可读存储介质,具有上述有益效果。

【技术实现步骤摘要】
节点服务异常处理方法、装置、设备及存储介质
本申请涉及系统通信
,特别涉及一种节点服务异常处理方法、装置、设备及一种可读存储介质。
技术介绍
集群中的节点通过虚拟IP与客户端建立连接,为客户端提供服务,如SMB服务,NFS服务等,当该服务发生异常不能正常为客户端提供服务时,客户端的业务就会断流甚至中断,而业务断流或中断的恢复时间长短直接关系到业务是否能稳定进行,还会影响用户体验。因此在节点服务异常时,保证在短时间内为客户端恢复是至关重要的。相关技术中,业务恢复机制是依靠虚拟IP的迁移,当某节点的服务故障时,就把客户端所连接的虚拟IP迁移至其他节点,客户端重新连接新的节点才能获取该服务。而客户端连接新的节点服务会耗费较长的时间,给客户带来不必要的等待延迟,影响用户体验。因此,如何减少由于节点服务异常导致客户端业务中断的时间,提升客户端从集群获得服务的连续性以及稳定性,是本领域技术人员急需解决的问题。
技术实现思路
本申请的目的是提供一种节点服务异常处理方法,该方法可以简化命令逻辑以及流程执行,保证存储设备的快速稳定运行;本申请的另一目的是提供一种节点服务异常处理装置、设备及一种可读存储介质。为解决上述技术问题,本申请提供一种节点服务异常处理方法,包括:接收到集群内第一节点的节点服务异常通知后,重启所述节点服务;判断所述节点服务是否恢复正常;若恢复正常,继续调用所述第一节点通过虚拟IP为客户端提供所述节点服务;若未恢复正常,判断所述重启的执行次数是否达到服务重启阈值;若未达到,执行重启所述节点服务的步骤;若达到,将所述虚拟IP迁移至第二节点,并调用所述第二节点通过所述虚拟IP为所述客户端提供所述节点服务;其中,所述第二节点为所述集群内的非异常节点。可选地,在将所述虚拟IP迁移至第二节点之后,还包括:重启所述第一节点的所述节点服务;若所述第一节点的所述节点服务恢复正常,将集群非异常节点作为待分配节点;其中,所述待分配节点包括所述第一节点;将集群虚拟IP分配重分配至各所述待分配节点。可选地,在将所述虚拟IP迁移至第二节点之前,还包括:将集群非异常节点作为待分配节点;将集群虚拟IP分配重分配至各所述待分配节点;确定所述第一节点的所述虚拟IP重分配的节点,作为第二节点。可选地,所述将集群虚拟IP分配重分配至各所述待分配节点,包括:确定当前所述集群各节点下无业务的虚拟IP;将所述当前无业务的虚拟IP重分配至各所述待分配节点。可选地,在重启所述节点服务之前,还包括:接收用户自定义的服务重启阈值。本申请还提供了一种节点服务异常处理装置,应用于集群节点的CTDB,该装置包括:重启启动单元,用于接收到集群内第一节点的节点服务异常通知后,重启所述节点服务;恢复判别单元,用于判断所述节点服务是否恢复正常;若恢复正常,触发第一处理单元;若未恢复正常,触发阈值判断单元;所述第一处理单元,用于继续调用所述第一节点通过虚拟IP为客户端提供所述节点服务;所述阈值判断单元,用于判断所述重启的执行次数是否达到服务重启阈值;若未达到,跳转至所述重启启动单元;若达到,触发IP迁移单元;所述IP迁移单元,用于将所述虚拟IP迁移至第二节点,并调用所述第二节点通过所述虚拟IP为所述客户端提供所述节点服务;其中,所述第二节点为所述集群内的非异常节点。可选地,所述节点服务异常处理装置还包括持续重启单元,用于在将所述虚拟IP迁移至第二节点之后,重启所述第一节点的所述节点服务;若所述第一节点的所述节点服务恢复正常,将集群非异常节点作为待分配节点;其中,所述待分配节点包括所述第一节点;将集群虚拟IP分配重分配至各所述待分配节点。可选地,所述节点服务异常处理装置还包括:重分配单元,用于在将所述虚拟IP迁移至第二节点之前,将集群非异常节点作为待分配节点;将集群虚拟IP分配重分配至各所述待分配节点;确定所述第一节点的所述虚拟IP重分配的节点,作为第二节点。本申请还提供了一种计算机设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现所述的节点服务异常处理方法的步骤。本申请还提供了一种可读存储介质,所述可读存储介质上存储有程序,所述程序被处理器执行时实现所述节点服务异常处理方法的步骤。本申请所提供的节点服务异常处理方法,在节点服务异常时,首先尝试对该服务进行重启操作,若在规定的服务重启阈值次数内成功的将该服务拉起,服务正常,则继续通过虚拟IP为客户端提供服务,无需重新连接,由于重启服务的执行时间要远小于虚拟IP发生迁移并与客户端重新建立连接所消耗的时间,且可以实现服务异常的恢复,因此在异常后重复执行重启操作有助于快速恢复对客户端的业务提供,最大限度的缩短客户端因为节点服务异常所等待的恢复时间,增强客户体验;如果在规定服务重启阈值次数内仍然无法拉起服务,服务仍然异常时,为保证服务的持续运行,将为客户端提供服务的虚拟IP进行集群内部迁移,迁移至集群内部其他正常的节点,客户端与新节点重新建立连接,继续从集群获取该服务,从而可以保证服务的持续稳定运行。本申请还提供了一种节点服务异常处理装置、设备及一种可读存储介质,具有上述有益效果,在此不再赘述。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的一种节点服务异常处理方法的流程图;图2为本申请实施例提供的一种客户端与集群节点连接示意图;图3为本申请实施例提供的一种通知机制示意图;图4为本申请实施例提供的一种CTDB成功拉起异常服务继续为客户端提供服务的连接示意图;图5为本申请实施例提供的一种CTDB拉起异常服务失败后业务转移连接至节点2的示意图;图6为本申请实施例提供的一种业务转移后CTDB成功拉起异常服务连接示意图;图7为本申请实施例提供的一种处理机制流程示意图;图8为本申请实施例提供的一种节点服务异常处理装置的结构框图;图9为本申请实施例提供的一种计算机设备的结构示意图。具体实施方式本申请的核心是提供一种节点服务异常处理方法,该方法可以简化命令逻辑以及流程执行,保证存储设备的快速稳定运行;本申请的另一核心是提供一种节点服务异常处理装置、设备及一种可读存储介质。为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通本文档来自技高网...

【技术保护点】
1.一种节点服务异常处理方法,其特征在于,包括:/n接收到集群内第一节点的节点服务异常通知后,重启所述节点服务;/n判断所述节点服务是否恢复正常;/n若恢复正常,继续调用所述第一节点通过虚拟IP为客户端提供所述节点服务;/n若未恢复正常,判断所述重启的执行次数是否达到服务重启阈值;/n若未达到,执行重启所述节点服务的步骤;/n若达到,将所述虚拟IP迁移至第二节点,并调用所述第二节点通过所述虚拟IP为所述客户端提供所述节点服务;其中,所述第二节点为所述集群内的非异常节点。/n

【技术特征摘要】
1.一种节点服务异常处理方法,其特征在于,包括:
接收到集群内第一节点的节点服务异常通知后,重启所述节点服务;
判断所述节点服务是否恢复正常;
若恢复正常,继续调用所述第一节点通过虚拟IP为客户端提供所述节点服务;
若未恢复正常,判断所述重启的执行次数是否达到服务重启阈值;
若未达到,执行重启所述节点服务的步骤;
若达到,将所述虚拟IP迁移至第二节点,并调用所述第二节点通过所述虚拟IP为所述客户端提供所述节点服务;其中,所述第二节点为所述集群内的非异常节点。


2.如权利要求1所述的节点服务异常处理方法,其特征在于,在将所述虚拟IP迁移至第二节点之后,还包括:
重启所述第一节点的所述节点服务;
若所述第一节点的所述节点服务恢复正常,将集群非异常节点作为待分配节点;其中,所述待分配节点包括所述第一节点;
将集群虚拟IP分配重分配至各所述待分配节点。


3.如权利要求1所述的节点服务异常处理方法,其特征在于,在将所述虚拟IP迁移至第二节点之前,还包括:
将集群非异常节点作为待分配节点;
将集群虚拟IP分配重分配至各所述待分配节点;
确定所述第一节点的所述虚拟IP重分配的节点,作为第二节点。


4.如权利要求2或3所述的节点服务异常处理方法,其特征在于,所述将集群虚拟IP分配重分配至各所述待分配节点,包括:
确定当前所述集群各节点下无业务的虚拟IP;
将所述当前无业务的虚拟IP重分配至各所述待分配节点。


5.如权利要求1所述的节点服务异常处理方法,其特征在于,在重启所述节点服务之前,还包括:
接收用户自定义的服务重启阈值。


6.一种节点服务异常处理装置,其特征在于,应用于集群...

【专利技术属性】
技术研发人员:李二明
申请(专利权)人:广东浪潮大数据研究有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1