【技术实现步骤摘要】
本申请涉及计算机,更具体地说,涉及一种故障处理方法、装置及电子设备和存储介质。
技术介绍
1、分布式存储集群通常依赖某种分布式一致性协议构建一致性框架,并依赖一致性框架提供的集群内一致状态协调集群内各节点的行为,以实现集群的高扩展和高可用。一致性框架中设计有一组控制状态机子组件和对应的应用端,在一致性框架的协调下,每个节点上的控制状态机对集群状态进行一致的读写,并控制各自节点上的应用端在相同的状态下作出相同的行为,从而完成集群内各节点协调行动的效果。
2、在正常运行情况下集群内所有节点的状态一致和行为一致,但是如果集群状态发生了异常改变,这一异常值会被集群内所有节点上的状态机读取到,由于所有状态机的行为一致,集群内的所有节点在读取到相同异常值后都会终止业务进程,导致业务和集群宕机。在相关技术中,此类问题发生后高度依赖实施人员进行人工恢复,故障处理以及集群恢复效率较低。
3、因此,如何提高故障处理和集群恢复效率是本领域技术人员需要解决的技术问题。
技术实现思路
1、本
...【技术保护点】
1.一种故障处理方法,其特征在于,应用于分布式存储集群中的节点,所述方法包括:
2.根据权利要求1所述故障处理方法,其特征在于,向所述目标业务模块控制层查询并更新最新节点状态之后,还包括:
3.根据权利要求2所述故障处理方法,其特征在于,向所述主节点发送目标数量的基本事件之后,还包括:
4.根据权利要求3所述故障处理方法,其特征在于,将集群状态由恢复状态修改为正常状态之后,还包括:
5.根据权利要求2所述故障处理方法,其特征在于,所述参与集群恢复的节点为按照预设规则修改所述分布式存储集群中的节点的事件级别之后根据节点的事
...【技术特征摘要】
1.一种故障处理方法,其特征在于,应用于分布式存储集群中的节点,所述方法包括:
2.根据权利要求1所述故障处理方法,其特征在于,向所述目标业务模块控制层查询并更新最新节点状态之后,还包括:
3.根据权利要求2所述故障处理方法,其特征在于,向所述主节点发送目标数量的基本事件之后,还包括:
4.根据权利要求3所述故障处理方法,其特征在于,将集群状态由恢复状态修改为正常状态之后,还包括:
5.根据权利要求2所述故障处理方法,其特征在于,所述参与集群恢复的节点为按照预设规则修改所述分布式存储集群中的节点的事件级别之后根据节点的事件级别确定的。
6.根据权利要求2所述故障处理方法,其特征在于,所述目标数量个基本事件为所述目标数量个空事件。
7.根据权利要求1所述故障处理方法,其特征在于,主节点在将集群状态修改为恢复状态之后,当不存在挂起状态的节点时,通过自身的业务模块控制层依次提交所述第一集群恢复事件和所述第二集群恢复事件。
8.根据权利要求1所述故障处理方法,其特征在于,所述节点状态修改事件包括节点添加事件、节点挂起事件、节点解挂事件、节点移除事件中任一项或任几项的组合。
9.根据权利要求1所述故障处理方法,其特征在于,所述关键信息包括磁盘阵列配置信息、存储池配置信息、虚拟卷配置信息中任一项或任几项的组合...
【专利技术属性】
技术研发人员:赵鹏,郭强,刘清林,
申请(专利权)人:苏州元脑智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。