一种分布式复制块设备脑裂的处理方法、装置及设备制造方法及图纸

技术编号:34928142 阅读:18 留言:0更新日期:2022-09-15 07:22
本申请适用于存储技术领域,公开了一种分布式复制块设备脑裂的处理方法、装置、设备及计算机可读存储介质,通过在检测到一对互为主从关系的分布式复制块设备发生脑裂事件时,检测两个分布式复制块设备的世代标识符元组的一致性状态,能够确定两设备具有主从关系且能够确定两设备的数据同步情况,进而可以通过预先制定的与每种一致性状态对应的脑裂处理策略,确定两个分布式复制块设备的主从角色关系,基于主从角色关系为两个分布式复制块设备重建分布式复制块设备同步机制,解决了现有脑裂自动恢复策略应用场景受限的问题,有效降低了分布式复制块设备脑裂恢复对人工的依赖,从而能够快速解决分布式复制块设备脑裂问题。而能够快速解决分布式复制块设备脑裂问题。而能够快速解决分布式复制块设备脑裂问题。

【技术实现步骤摘要】
一种分布式复制块设备脑裂的处理方法、装置及设备


[0001]本申请涉及存储
,特别是涉及一种分布式复制块设备脑裂的处理方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]分布式复制块设备(Distributed Replicated Block Device,DRBD)技术是一种基于TCP/IP的分布式块复制存储解决方案,通过对块设备(如硬盘,分区,逻辑卷等)虚拟化分布式复制块设备资源,配置同步复制或异步复制模式,实现主节点和备节点块设备的实时镜像功能,基于心跳(Heartbeat)+分布式复制块设备高可用技术广泛应用于存储系统远程复制方案中。
[0003]但是,由于分布式复制块设备技术基于网络传输,当主从节点心跳网络连接中断时,主节点上的主设备和从节点上的从设备各自的资源均有可能在连接中断期间变为主角色,则有可能发生争抢资源的情况,引发“脑裂”问题。
[0004]现有解决分布式复制块设备脑裂问题,主要有手动处理脑裂和自动处理脑裂两种方案。分布式复制块设备本身提供了脑裂自动恢复策略,当网络恢复后,分布式复制块设备所在节点会根据检测到的脑裂时主节点角色(Primary role)的数量自动运行脑裂自动恢复策略,使得分布式复制块设备从脑裂中自动恢复。
[0005]但是分布式复制块设备提供的脑裂自动恢复策略必须在确定两个分布式复制块设备谁为主设备谁为从设备时才能进行自动恢复,且脑裂自动恢复策略导致的数据分歧,可能会在一定程度上丢失用户重要的数据。因此,现有的脑裂自动恢复策略应用场景受限。
[0006]当脑裂自动恢复策略无法发挥作用时,需要通知技术人员进行手动脑裂恢复,但这无疑延长了脑裂恢复所需的时间。

技术实现思路

[0007]本申请的目的是提供一种分布式复制块设备脑裂的处理方法、装置、设备及计算机可读存储介质,用于降低分布式复制块设备脑裂恢复对人工的依赖,适用更多应用场景。
[0008]为解决上述技术问题,本申请提供一种分布式复制块设备脑裂的处理方法,包括:
[0009]当检测到一对互为主从关系的分布式复制块设备发生脑裂事件时,检测两个所述分布式复制块设备的世代标识符元组的一致性状态;
[0010]根据所述一致性状态以及与所述一致性状态对应的脑裂处理策略,确定两个所述分布式复制块设备的主从角色关系;
[0011]基于所述主从角色关系为两个所述分布式复制块设备重建分布式复制块设备同步机制。
[0012]可选的,所述检测到一对互为主从关系的分布式复制块设备发生脑裂事件,具体为:
[0013]检测到所述分布式复制块设备在与互为主从关系的另一所述分布式复制块设备
的心跳信号断开再恢复后、所述世代标识符元组不一致时上报的所述脑裂事件。
[0014]可选的,所述根据所述一致性状态以及与所述一致性状态对应的脑裂处理策略,确定两个所述分布式复制块设备的主从角色关系,具体为:
[0015]当所述一致性状态为磁盘同步位图变化跟踪代的全局唯一标识符一致,当前数据代的全局唯一标识符不一致时,在两个所述分布式复制块设备中,以数据更新时间最新的为主设备,另一所述分布式复制块设备为从设备。
[0016]可选的,所述根据所述一致性状态以及与所述一致性状态对应的脑裂处理策略,确定两个所述分布式复制块设备的主从角色关系,具体包括:
[0017]当所述一致性状态为磁盘同步位图变化跟踪代的全局唯一标识符一致,当前数据代的全局唯一标识符不一致时,若在系统数据库中获取到持久化处理的两个所述分布式复制块设备的主从角色关系配置信息,则以所述主从角色关系配置信息确定所述主从角色关系;
[0018]若检测到对其中一个所述分布式复制块设备的升主设备处理命令,则以所述升主设备处理命令确定所述主从角色关系。
[0019]可选的,所述根据所述一致性状态以及与所述一致性状态对应的脑裂处理策略,确定两个所述分布式复制块设备的主从角色关系,具体包括:
[0020]当所述一致性状态为磁盘同步位图变化跟踪代的全局唯一标识符不一致,当前数据代的全局唯一标识符也不一致时,若在系统数据库中获取到持久化处理的两个所述分布式复制块设备的主从角色关系配置信息,则以所述主从角色关系配置信息确定所述主从角色关系;
[0021]若未获取到所述主从角色关系配置信息,则生成告警信息以触发用户手动处理。
[0022]可选的,所述基于所述主从角色关系为两个所述分布式复制块设备重建分布式复制块设备同步机制,具体包括:
[0023]将所述主从角色关系中的从设备置为脱机状态后,建立所述从设备与所述主从角色关系中的主设备之间的链接;
[0024]基于所述链接,重建所述主设备与所述从设备的连接关系对,以使所述主设备向所述从设备启动数据同步。
[0025]可选的,所述建立所述从设备与所述主从角色关系中的主设备之间的链接,具体包括:
[0026]控制所述从设备所在节点向所述主设备所在节点发起连接请求;
[0027]将所述主设备置为脱机状态,并控制所述主设备所在节点与所述从设备所在节点连接,以建立所述链接。
[0028]可选的,在所述建立所述从设备与所述主从角色关系中的主设备之间的链接之前,还包括:
[0029]将所述从设备的数据还原至所述脑裂事件发起的时间点。
[0030]可选的,所述当检测到一对互为主从关系的分布式复制块设备发生脑裂事件时,检测两个所述分布式复制块设备的世代标识符元组的一致性状态,具体包括:
[0031]当检测到所述脑裂事件时,调用预先部署于分布式复制块设备资源配置文件中的脑裂处理脚本;
[0032]执行所述脑裂处理脚本,进入所述检测两个所述分布式复制块设备的世代标识符元组的一致性状态的步骤。
[0033]可选的,应用于两个所述分布式复制块设备各自所在的节点。
[0034]为解决上述技术问题,本申请还提供一种分布式复制块设备脑裂的处理装置,包括:
[0035]检测单元,用于当检测到一对互为主从关系的分布式复制块设备发生脑裂事件时,检测两个所述分布式复制块设备的世代标识符元组的一致性状态;
[0036]确定单元,用于根据所述一致性状态以及与所述一致性状态对应的脑裂处理策略,确定两个所述分布式复制块设备的主从角色关系;
[0037]重建单元,用于基于所述主从角色关系为两个所述分布式复制块设备重建分布式复制块设备同步机制。
[0038]为解决上述技术问题,本申请还提供一种分布式复制块设备脑裂的处理设备,包括:
[0039]存储器,用于存储计算机程序;
[0040]处理器,用于执行所述计算机程序,所述计算机程序被所述处理器执行时实现如上述任意一项所述分布式复制块设备脑裂的处理方法的步骤。
[0041]为解决上述技术问题,本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式复制块设备脑裂的处理方法,其特征在于,包括:当检测到一对互为主从关系的分布式复制块设备发生脑裂事件时,检测两个所述分布式复制块设备的世代标识符元组的一致性状态;根据所述一致性状态以及与所述一致性状态对应的脑裂处理策略,确定两个所述分布式复制块设备的主从角色关系;基于所述主从角色关系为两个所述分布式复制块设备重建分布式复制块设备同步机制。2.根据权利要求1所述的处理方法,其特征在于,所述检测到一对互为主从关系的分布式复制块设备发生脑裂事件,具体为:检测到所述分布式复制块设备在与互为主从关系的另一所述分布式复制块设备的心跳信号断开再恢复后、所述世代标识符元组不一致时上报的所述脑裂事件。3.根据权利要求1所述的处理方法,其特征在于,所述根据所述一致性状态以及与所述一致性状态对应的脑裂处理策略,确定两个所述分布式复制块设备的主从角色关系,具体为:当所述一致性状态为磁盘同步位图变化跟踪代的全局唯一标识符一致,当前数据代的全局唯一标识符不一致时,在两个所述分布式复制块设备中,以数据更新时间最新的为主设备,另一所述分布式复制块设备为从设备。4.根据权利要求1所述的处理方法,其特征在于,所述根据所述一致性状态以及与所述一致性状态对应的脑裂处理策略,确定两个所述分布式复制块设备的主从角色关系,具体包括:当所述一致性状态为磁盘同步位图变化跟踪代的全局唯一标识符一致,当前数据代的全局唯一标识符不一致时,若在系统数据库中获取到持久化处理的两个所述分布式复制块设备的主从角色关系配置信息,则以所述主从角色关系配置信息确定所述主从角色关系;若检测到对其中一个所述分布式复制块设备的升主设备处理命令,则以所述升主设备处理命令确定所述主从角色关系。5.根据权利要求1所述的处理方法,其特征在于,所述根据所述一致性状态以及与所述一致性状态对应的脑裂处理策略,确定两个所述分布式复制块设备的主从角色关系,具体包括:当所述一致性状态为磁盘同步位图变化跟踪代的全局唯一标识符不一致,当前数据代的全局唯一标识符也不一致时,若在系统数据库中获取到持久化处理的两个所述分布式复制块设备的主从角色关系配置信息,则以所述主从角色关系配置信息确定所述主从角色关系;若未获取到所述主从角色关系配置信息,则生成告警信息以触发用户手动处理。6.根据权利要求1所述的处理方法,其特征在于,所述...

【专利技术属性】
技术研发人员:李奋翔
申请(专利权)人:济南浪潮数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1