一种故障处理方法、装置及电子设备和存储介质制造方法及图纸

技术编号:41466216 阅读:13 留言:0更新日期:2024-05-30 14:21
本申请公开了一种故障处理方法、装置及电子设备和存储介质,涉及计算机技术领域,该方法包括:当执行目标事件发生错误时,终止所述目标事件的执行,将集群状态修改为恢复状态,并按照预设规则修改自身的事件级别;其中,主节点将集群状态修改为恢复状态之后,依次提交第一集群恢复事件和第二集群恢复事件;在所述恢复状态下,通过自身的目标业务模块控制层处理节点状态修改事件;当接收到所述第一集群恢复事件时,保留关键信息,丢弃非关键信息;其中,所述关键信息包括配置信息;当接收到所述第二集群恢复事件时,向自身的目标业务模块控制层查询并更新最新节点状态。本申请提高了故障处理和集群恢复效率。

【技术实现步骤摘要】

本申请涉及计算机,更具体地说,涉及一种故障处理方法、装置及电子设备和存储介质


技术介绍

1、分布式存储集群通常依赖某种分布式一致性协议构建一致性框架,并依赖一致性框架提供的集群内一致状态协调集群内各节点的行为,以实现集群的高扩展和高可用。一致性框架中设计有一组控制状态机子组件和对应的应用端,在一致性框架的协调下,每个节点上的控制状态机对集群状态进行一致的读写,并控制各自节点上的应用端在相同的状态下作出相同的行为,从而完成集群内各节点协调行动的效果。

2、在正常运行情况下集群内所有节点的状态一致和行为一致,但是如果集群状态发生了异常改变,这一异常值会被集群内所有节点上的状态机读取到,由于所有状态机的行为一致,集群内的所有节点在读取到相同异常值后都会终止业务进程,导致业务和集群宕机。在相关技术中,此类问题发生后高度依赖实施人员进行人工恢复,故障处理以及集群恢复效率较低。

3、因此,如何提高故障处理和集群恢复效率是本领域技术人员需要解决的技术问题。


技术实现思路

1、本申请的目的在于提供一本文档来自技高网...

【技术保护点】

1.一种故障处理方法,其特征在于,应用于分布式存储集群中的节点,所述方法包括:

2.根据权利要求1所述故障处理方法,其特征在于,向所述目标业务模块控制层查询并更新最新节点状态之后,还包括:

3.根据权利要求2所述故障处理方法,其特征在于,向所述主节点发送目标数量的基本事件之后,还包括:

4.根据权利要求3所述故障处理方法,其特征在于,将集群状态由恢复状态修改为正常状态之后,还包括:

5.根据权利要求2所述故障处理方法,其特征在于,所述参与集群恢复的节点为按照预设规则修改所述分布式存储集群中的节点的事件级别之后根据节点的事件级别确定的。...

【技术特征摘要】

1.一种故障处理方法,其特征在于,应用于分布式存储集群中的节点,所述方法包括:

2.根据权利要求1所述故障处理方法,其特征在于,向所述目标业务模块控制层查询并更新最新节点状态之后,还包括:

3.根据权利要求2所述故障处理方法,其特征在于,向所述主节点发送目标数量的基本事件之后,还包括:

4.根据权利要求3所述故障处理方法,其特征在于,将集群状态由恢复状态修改为正常状态之后,还包括:

5.根据权利要求2所述故障处理方法,其特征在于,所述参与集群恢复的节点为按照预设规则修改所述分布式存储集群中的节点的事件级别之后根据节点的事件级别确定的。

6.根据权利要求2所述故障处理方法,其特征在于,所述目标数量个基本事件为所述目标数量个空事件。

7.根据权利要求1所述故障处理方法,其特征在于,主节点在将集群状态修改为恢复状态之后,当不存在挂起状态的节点时,通过自身的业务模块控制层依次提交所述第一集群恢复事件和所述第二集群恢复事件。

8.根据权利要求1所述故障处理方法,其特征在于,所述节点状态修改事件包括节点添加事件、节点挂起事件、节点解挂事件、节点移除事件中任一项或任几项的组合。

9.根据权利要求1所述故障处理方法,其特征在于,所述关键信息包括磁盘阵列配置信息、存储池配置信息、虚拟卷配置信息中任一项或任几项的组合...

【专利技术属性】
技术研发人员:赵鹏郭强刘清林
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1