一种双控集群故障恢复的方法、系统及设备技术方案

技术编号:26478423 阅读:26 留言:0更新日期:2020-11-25 19:22
本申请公开了一种双控集群故障恢复的方法,包括:确定后发生故障的控制器为第一控制器,确定先发生故障的控制器为第二控制器;控制第一控制器获取第一内存中的固化信息进行恢复,并将第一控制器中的配置信息同步到业务端,以恢复业务端的io业务;当业务端的io业务处理完成后,将第一控制器中的固化信息同步到第二控制器中,并控制第一控制器和第二控制器同时恢复业务流程。本申请降低了数据恢复的难度,并使得两个控制器不会因业务端io业务的不同而导致数据不同,进而保证了双控制器集群的两个控制器都出现故障时,恢复的数据在双控间的一致性及可靠性。本申请还提供了一种双控集群故障恢复的系统、设备及可读存储介质,具有上述有益效果。

【技术实现步骤摘要】
一种双控集群故障恢复的方法、系统及设备
本申请涉及集群故障恢复领域,特别涉及一种双控集群故障恢复的方法、系统、设备及可读存储介质。
技术介绍
为了提高存储系统的可用性,保障业务的连续性,人们设计了集群存储系统,集群内的各控制器节点通过网络等手段进行通信。目前使用最广泛的是由两个控制器组成的双控制器集群。双控制器集群的后端存储介质是通过光纤或SAS链路共享磁盘阵列的逻辑卷,或是通过SAS链路共享expander上的磁盘,前端业务则是通过以太网或光纤,使用nfs、cifs、scst等协议,提供文件级或块级的存储导出服务。双控制器集群有两种工作模式,一种是active-standby模式:集群中的两个控制器一个为主控制器,另一个为备控制器。应用程序主要运行在主控制器上,当主控制器出现故障时,通知备控制器接管原先在主控制器上的业务,以使业务不间断;另一种是active-active模式:集群中的两个控制器同时对外提供业务,两个控制器互为主备,一个控制器出现故障后,将其上的业务切换到另一个控制器上。然而,当双控制器集群的两个控制器都出现故本文档来自技高网...

【技术保护点】
1.一种双控集群故障恢复的方法,其特征在于,包括:/n确定后发生故障的控制器为第一控制器,确定先发生故障的控制器为第二控制器;/n控制所述第一控制器获取第一内存中的固化信息进行恢复,并将所述第一控制器中的配置信息同步到业务端,以恢复所述业务端的io业务;/n当所述业务端的io业务处理完成后,将所述第一控制器中的固化信息同步到所述第二控制器中,并控制所述第一控制器和所述第二控制器同时恢复业务流程。/n

【技术特征摘要】
1.一种双控集群故障恢复的方法,其特征在于,包括:
确定后发生故障的控制器为第一控制器,确定先发生故障的控制器为第二控制器;
控制所述第一控制器获取第一内存中的固化信息进行恢复,并将所述第一控制器中的配置信息同步到业务端,以恢复所述业务端的io业务;
当所述业务端的io业务处理完成后,将所述第一控制器中的固化信息同步到所述第二控制器中,并控制所述第一控制器和所述第二控制器同时恢复业务流程。


2.根据权利要求1所述的方法,其特征在于,将所述第一控制器中的配置信息同步到业务端,以恢复所述业务端的io业务,包括:
将所述业务端的各个模块设置为单控制器处理模式,所述业务端包括位图数据模块、元数据模块、垃圾回收模块中的至少一项;
将所述第一控制器中的配置信息同步到所述业务端的各个模块,以恢复所述业务端的io业务。


3.根据权利要求2所述的方法,其特征在于,控制所述第一控制器和所述第二控制器同时恢复业务流程,包括:
将所述业务端的各个模块设置为双控制器处理模式,并控制所述第一控制器和所述第二控制器同时恢复业务流程。


4.根据权利要求1所述的方法,其特征在于,所述固化信息包括所述配置信息、元数据和位图数据,将所述第一控制器中的固化信息同步到所述第二控制器中,包括:
将所述第一控制器中的配置信息同步到所述第二控制器中,并控制所述第二控制器将第二内存中的元数据和位图数据丢弃;
令所述第一控制器和所述第二控制器同时中断业务流程,并将所述第一控制器中的元数据和位图数据同步到所述第二控制器中。


5.一种双控集群故障恢复的系统,其特征在于,包括:
确定单元,用于确定后发生故障的控制器为第一控制器,确定先发生故障的控制器为第二控制器;
第一恢复单元,用于控制所述第一控制器获取第一...

【专利技术属性】
技术研发人员:张孙旻
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1