【技术实现步骤摘要】
一种存储系统的集群结构中元数据的恢复方法及系统
本专利技术涉及存储系统领域,特别是涉及一种存储系统的集群结构中元数据的恢复方法及系统。
技术介绍
存储系统作为所有计算机相关业务的底层基础,对于其可靠性的要求十分高,因此在设计的时候需要考虑高可用性。一般通过集群方式来保障。一个集群中具有多个控制器(本专利以一个集群中有两个控制器为例),当其中的一个控制器发生故障无法提供服务时,存活的控制器需要接管故障控制器的所有业务,在该过程中上方业务不允许停止。在单控故障的时候,将会由集群中的另一个控制器做接管。然后之前故障的控制器在经过处理(例如重启操作)重新加入集群的时候,两个控制器需要做一些操作来完成控制器的回切,即恢复之前的双控运行模式。此处主要涉及到了上层业务I/O的处理、写缓存给事务模块返回的失败请求的重做、以及元数据树的根节点的恢复,以及写入模式和业主节点的切换。在一般的设计中,控制器做回切的时候一般为双控进行,即此时写入模式和业主节点都切换为双控状态,但是一旦这种情况下其中一个控制器再次发生故障,则很
【技术保护点】
1.一种存储系统的集群结构中元数据的恢复方法,其特征在于,包括以下步骤:S100,第一控制器中第一节点进行故障回切;S200,所述第一控制器判断故障回切过程中所述第一节点是否发生软件故障;S300,若所述第一节点没有发生软件故障,则第二控制器中第二节点进行故障回切;S400,若所述第一节点发生软件故障,则所述第二控制器中第二节点进行故障接管;S500,所述第一节点和所述第二节点通知元数据模块回切完成。/n
【技术特征摘要】
1.一种存储系统的集群结构中元数据的恢复方法,其特征在于,包括以下步骤:S100,第一控制器中第一节点进行故障回切;S200,所述第一控制器判断故障回切过程中所述第一节点是否发生软件故障;S300,若所述第一节点没有发生软件故障,则第二控制器中第二节点进行故障回切;S400,若所述第一节点发生软件故障,则所述第二控制器中第二节点进行故障接管;S500,所述第一节点和所述第二节点通知元数据模块回切完成。
2.根据权利要求1所述的一种存储系统的集群结构中元数据的恢复方法,其特征在于:所述S100步骤中,所述第一节点进行故障回切时,所述第一节点进入静默状态,此时第一控制器新下达的业务加入暂存链表中;所述第一节点中写缓存模块开始下刷;所述第一节点切换归属节点和写入模式;所述第一节点进行事务重做,处理所述写缓存模块未完成的请求。
3.根据权利要求1所述的一种存储系统的集群结构中元数据的恢复方法,其特征在于:所述S300步骤中,所述第二节点进行故障回切时,所述第二节进行根节点恢复;所述第二节点切换切换归属节点和写入模式;所述第二节点进行事务重做;所述第一节点关闭静默状态。
4.根据权利要求1所述的一种存储系统的集群结构中元数据的恢复方法,其特征在于:所述S400步骤中,所述第二控制器中第二节点进行故障接管时,所述第一节点将内存事务数据存储到磁盘中;所述第二节点切换归属节点和写入模式;所述第二节点进行根节点恢复并读取磁盘中所述第一节点的事务数据,进行事务...
【专利技术属性】
技术研发人员:王新忠,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。