【技术实现步骤摘要】
故障处理方法、装置、设备及介质
本申请涉及存储
,特别涉及一种统一存储设备节点故障处理方法、装置、设备、介质。
技术介绍
参见图1所示,为当前统一存储设备的结构示意图。当前的统一存储设备通常都由多个控制器组成冗余结构,最常用的方式为两个控制器(即两个Node)组成一个控制器组IoGroup,进而再由多个IoGroup组成最终的多控集群。在图1所示的架构下,由于掉电、业务故障等原因,有可能出现同一个IoGroup中两个节点都因为故障退出的场景,例如一个节点故障后引发另一个节点故障,或者因掉电使得两节点同时断电退出集群等,这种场景下由于同一个IoGroup中会出现两个node都不在的场景,因而故障前数据的保存以及节点重新加入时数据的恢复流程就变得尤其重要。也即,如何处理故障退出之后重新加入的控制器节点,以便保障控制器节点重新加入之后数据与故障前数据的一致性是本领域技术人员要解决的问题。
技术实现思路
有鉴于此,本申请的目的在于提供一种统一存储设备节点故障处理方法、装置、设备、介质,能够对统一控制 ...
【技术保护点】
1.一种统一存储设备节点故障处理方法,其特征在于,应用于预设的节点事件处理模块,包括:/n获取目标统一存储设备的集群管理模块下发的节点恢复事件,其中,所述目标统一存储设备包括多个控制器组,每个控制器组包括两个控制器,所述集群管理模块为所述目标统一存储设备的事件管理模块,所述节点事件处理模块为所述集群管理模块的子模块,用于管理所述目标统一存储设备中的部分控制器组;/n获取所述节点恢复事件对应的待恢复控制器中的目标参数,其中,所述目标参数包括第一目标参数和第二目标参数,所述第一目标参数用于记录所述待恢复控制器的故障信息,所述第二目标参数用于记录参考控制器的故障信息,所述参考控制 ...
【技术特征摘要】
1.一种统一存储设备节点故障处理方法,其特征在于,应用于预设的节点事件处理模块,包括:
获取目标统一存储设备的集群管理模块下发的节点恢复事件,其中,所述目标统一存储设备包括多个控制器组,每个控制器组包括两个控制器,所述集群管理模块为所述目标统一存储设备的事件管理模块,所述节点事件处理模块为所述集群管理模块的子模块,用于管理所述目标统一存储设备中的部分控制器组;
获取所述节点恢复事件对应的待恢复控制器中的目标参数,其中,所述目标参数包括第一目标参数和第二目标参数,所述第一目标参数用于记录所述待恢复控制器的故障信息,所述第二目标参数用于记录参考控制器的故障信息,所述参考控制器为所述待恢复控制器所属控制组中的另一个控制器;
根据所述目标参数对所述待恢复控制器进行服务恢复。
2.根据权利要求1所述的统一存储设备节点故障处理方法,其特征在于,所述根据所述目标参数对所述待恢复控制器进行服务恢复,包括:
如果所述目标参数中的第一目标参数和第二目标参数均为第一预设值,则确定所述参考控制器的运行状态;
如果所述参考控制器处于正常运行中,则向所述待恢复控制器下发恢复信息,以便所述待恢复控制器根据所述恢复信息从所述参考控制器中同步目标配置数据,以进行服务恢复。
3.根据权利要求2所述的统一存储设备节点故障处理方法,其特征在于,所述确定所述参考控制器的运行状态之后,还包括:
如果所述参考控制器处于故障中,或所述参考控制器处于故障恢复中,则获取所述参考控制器中的第三目标参数和第四目标参数,其中,第三目标参数用于记录所述待恢复控制器的故障信息,所述第四目标参数用于记录所述参考控制器的故障信息;
根据所述第三目标参数和第四目标参数对所述待恢复控制器进行服务恢复。
4.根据权利要求3所述的统一存储设备节点故障处理方法,其特征在于,所述根据所述第三目标参数和第四目标参数对所述待恢复控制器进行服务恢复,包括:
如果所述第三目标参数和所述第四目标参数均为所述第一预设值,则向所述待恢复控制器下发恢复信息,以便所述待恢复控制器根据所述恢复信息从所述待恢复控制器的预设存储区域读取目标配置数据,以进行服务恢复。
5.根据权利要求3所述的统一存储设备节点故障处理方法,其特征在于,所述根据所述第三目标参数和第四目标参数对所述待恢复控制器进行服务恢复,包括:
如果所述第三目标参数为第二预设值...
【专利技术属性】
技术研发人员:刘文志,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。