System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 网络附加存储系统集群的故障恢复方法、装置及主机设备制造方法及图纸_技高网

网络附加存储系统集群的故障恢复方法、装置及主机设备制造方法及图纸

技术编号:40547819 阅读:9 留言:0更新日期:2024-03-05 19:05
本发明专利技术公开了一种网络附加存储系统集群的故障恢复方法、装置及主机设备,涉及网络附加存储系统技术领域,该方法包括:当前节点为网络附加存储系统集群的主节点时,检测网络附加存储系统集群中的离线节点;其中,当前节点为网络附加存储系统集群中的任一节点;根据当前节点与离线节点的通信状态和离线节点的主机状态,确定离线节点中的可恢复节点;其中,可恢复节点与当前节点的通信状态为可通信,可恢复节点的主机状态为主机正常;控制各可恢复节点配置集群配置文件,将各可恢复节点恢复到网络附加存储系统集群中;本发明专利技术能够检测识别NAS集群中可恢复的离线节点,将可恢复的离线节点自动恢复到NAS集群,降低了节点的运行压力和故障风险。

【技术实现步骤摘要】

本专利技术涉及网络附加存储系统,特别涉及一种网络附加存储系统集群的故障恢复方法、装置、主机设备及计算机可读存储介质。


技术介绍

1、目前,nas(network attach storage,网络附加存储系统)集群中,当有节点发生故障时,会导致该节点集群信息丢失;这就使得当该节点的虚拟机恢复正常时,因为虚拟机内不存在集群信息,无法重新加入到nas集群,也就无法恢复该节点的nas服务。以四节点的nas集群为例:集群管理系统会将故障节点的nas服务漂移到正常节点,通过正常节点提供故障节点的nas服务;当两个或三个节点故障时,原本分布于四个节点的nas服务会集中于一个或两个节点对外提供nas服务,增加了单节点运行压力,同时发生故障的风险也会增高。

2、因此,如何能够实现nas集群中故障节点的自动恢复,减少节点的运行压力,降低故障风险,是现今急需解决的问题。


技术实现思路

1、本专利技术的目的是提供一种网络附加存储系统集群的故障恢复方法、装置、主机设备及计算机可读存储介质,以实现nas集群中故障节点的自动恢复,减少节点的运行压力,降低故障风险。

2、为解决上述技术问题,本专利技术提供一种网络附加存储系统集群的故障恢复方法,包括:

3、当前节点为网络附加存储系统集群的主节点时,检测所述网络附加存储系统集群中的离线节点;其中,当前节点为所述网络附加存储系统集群中的任一节点;

4、根据当前节点与所述离线节点的通信状态和所述离线节点的主机状态,确定所述离线节点中的可恢复节点;其中,所述可恢复节点与当前节点的通信状态为可通信,所述可恢复节点的主机状态为主机正常;

5、控制各所述可恢复节点配置集群配置文件,将各所述可恢复节点恢复到所述网络附加存储系统集群中;其中,所述集群配置文件包括节点的集群配置信息和所述网络附加存储系统集群中全部节点的令牌信息。

6、在一些实施例中,所述当前节点为网络附加存储系统集群的主节点时,检测所述网络附加存储系统集群中的离线节点,包括:

7、监控当前节点是否为所述主节点;

8、若为所述主节点,则检测所述离线节点;

9、若不为所述主节点,则结束。

10、在一些实施例中,所述监控当前节点是否为所述主节点,包括:

11、利用监控进程,监控当前节点的节点类型和恢复进程的启用情况;

12、若所述节点类型为所述主节点,则在所述恢复进程的启用情况为未启用状态时,启动所述恢复进程,利用所述恢复进程检测所述离线节点;在所述恢复进程的启用情况为启用状态时,执行所述利用监控进程,监控当前节点的节点类型和恢复进程的启用情况的步骤;

13、若所述节点类型为从节点,则结束所述恢复进程。

14、在一些实施例中,该方法还包括:

15、当前节点为网络附加存储系统集群的从节点时,若当前节点为所述离线节点,则根据所述主节点的控制,恢复所述集群配置文件;

16、利用恢复的所述集群配置文件,重启所述网络附加存储系统集群的集群管理系统;

17、在所述集群管理系统重启成功后,向所述主节点发送认证指令,以使所述主节点根据所述认证指令,对当前节点认证成功后,令当前节点重新加入所述网络附加存储系统集群。

18、在一些实施例中,所述根据当前节点与所述离线节点的通信状态和所述离线节点的主机状态,确定所述离线节点中的可恢复节点,包括:

19、根据当前节点与所述离线节点的通信状态、所述离线节点的主机状态、集群信息情况和恢复标记文件情况,确定所述离线节点中的所述可恢复节点;其中,所述可恢复节点的集群信息情况为不存在集群信息或存在集群信息,且当前可恢复节点的集群信息情况为存在集群信息时,当前可恢复节点的恢复标记文件情况为不存在恢复标记文件;

20、对应的,所述控制各所述可恢复节点配置集群配置文件,将各所述可恢复节点恢复到所述网络附加存储系统集群中,包括:

21、控制各所述可恢复节点配置集群配置文件和恢复标记文件,将所述可恢复节点恢复到所述网络附加存储系统集群中。

22、在一些实施例中,所述根据当前节点与所述离线节点的通信状态、所述离线节点的主机状态、集群信息情况和恢复标记文件情况,确定所述离线节点中的所述可恢复节点,包括:

23、判断所述网络附加存储系统集群中是否存在所述离线节点;

24、若存在所述离线节点,则根据所述离线节点的恢复标记文件情况和集群信息情况,判断所述离线节点中是否存在重置节点;其中,所述重置节点的恢复标记文件情况为存在所述恢复标记文件且集群信息情况为存在集群信息;

25、若存在所述重置节点,则控制所述重置节点进行节点重置,以清除所述重置节点中的集群信息;

26、若不存在所述重置节点,则判断所述离线节点中是否存在可恢复节点;

27、若存在所述可恢复节点,则执行所述控制各所述可恢复节点配置集群配置文件和所述恢复标记文件,将所述可恢复节点恢复到所述网络附加存储系统集群中的步骤;

28、对应的,所述控制各所述可恢复节点配置集群配置文件和恢复标记文件,将所述可恢复节点恢复到所述网络附加存储系统集群中,包括:

29、控制各所述可恢复节点分别配置所述恢复标记文件;

30、向各所述可恢复节点发送各自对应的集群配置文件,以使各所述可恢复节点利用各自接收的集群配置文件,重启所述网络附加存储系统集群的集群管理系统;

31、对所述集群管理系统重启成功的可恢复节点进行认证,将认证成功的可恢复节点恢复到所述网络附加存储系统集群中,并控制认证成功的可恢复节点删除各自的恢复标记文件。

32、在一些实施例中,所述控制所述重置节点进行节点重置,包括:

33、通过安全外壳协议向各所述重置节点发送重置指令,以控制各所述重置节点进行节点重置。

34、本专利技术还提供了一种网络附加存储系统集群的故障恢复装置,应用于当前节点,包括:

35、检测模块,用于在当前节点为网络附加存储系统集群的主节点时,检测所述网络附加存储系统集群中的离线节点;其中,当前节点为所述网络附加存储系统集群中的任一节点;

36、确定模块,用于根据当前节点与所述离线节点的通信状态和所述离线节点的主机状态,确定所述离线节点中的可恢复节点;其中,所述可恢复节点与当前节点的通信状态为可通信,所述可恢复节点的主机状态为主机正常;

37、恢复模块,用于控制各所述可恢复节点配置集群配置文件,将各所述可恢复节点恢复到所述网络附加存储系统集群中;其中,所述集群配置文件包括节点的集群配置信息和所述网络附加存储系统集群中全部节点的令牌信息。

38、本专利技术还提供了一种主机设备,包括:

39、存储器,用于存储计算机程序;

40、处理器,用于执行所述计算机程序时实现如上述所述的网络附加存储系统集本文档来自技高网...

【技术保护点】

1.一种网络附加存储系统集群的故障恢复方法,其特征在于,包括:

2.根据权利要求1所述的网络附加存储系统集群的故障恢复方法,其特征在于,所述当前节点为网络附加存储系统集群的主节点时,检测所述网络附加存储系统集群中的离线节点,包括:

3.根据权利要求2所述的网络附加存储系统集群的故障恢复方法,其特征在于,所述监控当前节点是否为所述主节点,包括:

4.根据权利要求1所述的网络附加存储系统集群的故障恢复方法,其特征在于,还包括:

5.根据权利要求1至4任一项所述的网络附加存储系统集群的故障恢复方法,其特征在于,所述根据当前节点与所述离线节点的通信状态和所述离线节点的主机状态,确定所述离线节点中的可恢复节点,包括:

6.根据权利要求5所述的网络附加存储系统集群的故障恢复方法,其特征在于,所述根据当前节点与所述离线节点的通信状态、所述离线节点的主机状态、集群信息情况和恢复标记文件情况,确定所述离线节点中的所述可恢复节点,包括:

7.根据权利要求6所述的网络附加存储系统集群的故障恢复方法,其特征在于,所述控制所述重置节点进行节点重置,包括:

8.一种网络附加存储系统集群的故障恢复装置,其特征在于,应用于当前节点,包括:

9.一种主机设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的网络附加存储系统集群的故障恢复方法的步骤。

...

【技术特征摘要】

1.一种网络附加存储系统集群的故障恢复方法,其特征在于,包括:

2.根据权利要求1所述的网络附加存储系统集群的故障恢复方法,其特征在于,所述当前节点为网络附加存储系统集群的主节点时,检测所述网络附加存储系统集群中的离线节点,包括:

3.根据权利要求2所述的网络附加存储系统集群的故障恢复方法,其特征在于,所述监控当前节点是否为所述主节点,包括:

4.根据权利要求1所述的网络附加存储系统集群的故障恢复方法,其特征在于,还包括:

5.根据权利要求1至4任一项所述的网络附加存储系统集群的故障恢复方法,其特征在于,所述根据当前节点与所述离线节点的通信状态和所述离线节点的主机状态,确定所述离线节点中的可恢复节点,包括:

6...

【专利技术属性】
技术研发人员:储欣媛侯胜伟马桂杰
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1