一种磁盘阵列故障恢复方法及装置制造方法及图纸

技术编号:33538176 阅读:28 留言:0更新日期:2022-05-21 09:38
本申请公开了一种磁盘阵列故障恢复方法及装置,该磁盘阵列至少包括第一磁盘以及第二磁盘。当磁盘阵列中的第一磁盘发生故障时,可以获取该第一磁盘中的正常数据,并利用该第一磁盘中的正常数据对第二磁盘中的异常数据进行恢复,这样,可以尽可能多的保证第二磁盘上的数据为正常数据。如此,可以充分利用故障磁盘上的有效信息,实现对该故障磁盘上可被读取的数据信息的有效利用。的数据信息的有效利用。的数据信息的有效利用。

【技术实现步骤摘要】
一种磁盘阵列故障恢复方法及装置


[0001]本申请实施例涉及故障恢复
,尤其涉及一种磁盘阵列故障恢复方法及装置。

技术介绍

[0002]独立硬盘冗余阵列(RAID,Redundant Array of Independent Disks),为磁盘阵列中的一种,主要是利用虚拟化存储技术将多个硬盘组合起来,形成一个或多个硬盘阵列组,具备较高的容错特性,即当部分硬盘发生故障或者数据错误时,RAID可以恢复硬盘中的数据,以提高数据的完整性以及可靠性。
[0003]对于RAID1、RAID5、RAID5E以及RAID6等磁盘阵列,可能会存在单盘失效场景以及双盘失效场景。其中,单盘失效是指磁盘阵列中存在一个磁盘因为故障等原因而发生失效,双盘失效,即是指磁盘阵列中存在两个磁盘发生失效。当磁盘阵列出现双盘失效时,磁盘阵列会处于不可用状态,导致磁盘阵列出现严重的数据丢失。目前,当磁盘阵列中出现磁盘发生故障时,通常是将故障磁盘更换为新磁盘,并丢弃故障磁盘。此时,故障磁盘上所保存的可被读取的数据信息也会被摒弃,从而浪费了该故障磁盘上可被读取的数据信息资源。

技术实现思路

[0004]本申请实施例提供一种磁盘阵列故障恢复方法、装置及存储介质,用于实现对于故障磁盘上可被读取的数据信息的有效利用。
[0005]第一方面,本申请实施例提供一种磁盘阵列故障恢复方法,该磁盘阵列至少包括第一磁盘以及第二磁盘。当磁盘阵列中的第一磁盘发生故障时,可以获取该第一磁盘中的正常数据,并利用该第一磁盘中的正常数据对第二磁盘中的异常数据进行恢复。
[0006]由于在将第一磁盘更换为新磁盘之前,先利用该第一磁盘中的正常数据对磁盘阵列中的其它磁盘中的数据进行异常修复,以尽可能确保其它磁盘上的数据的可靠性与正确性,从而充分利用了故障磁盘上的有效信息,实现对该故障磁盘上可被读取的数据信息的有效利用,尽可能的将第二磁盘上出现的异常数据恢复成正常数据。
[0007]在一种可能的实施方式中,在利用第一磁盘中的正常数据对其它磁盘上的异常数据进行恢复后,可以再利用该其它磁盘上的数据对新磁盘进行数据重建,可以尽可能减少其它磁盘上出现异常数据而对该新磁盘重建效果的影响,从而提高磁盘阵列的故障恢复效果。
[0008]在一种可能的实施方式中,在故障恢复过程中,在对更换磁盘进行故障重建之前,还可以对第二磁盘中不可修复的异常数据进行隔离,从而避免第二磁盘中的异常数据对更换磁盘的数据重建的影响,如当第二磁盘中出现不可修复的异常数据时,该异常数据使得第一磁盘的更换磁盘上的相应数据重建失败,从而可能导致该更换磁盘的数据重建过程因为存在数据不可重建而使得更换磁盘重建失败(重建过程终止)。而通过对第二磁盘中不可修复的异常数据进行隔离,可以使得在对第一磁盘的更换磁盘进行数据重建过程中,更换
磁盘中对于部分无法被重建的数据可以因为第二磁盘上的异常数据被隔离而跳过相应数据的重建,从而可以避免更换磁盘数据重建过程因为存在数据重建失败而发生终止,提高更换磁盘的数据重建的成功率。
[0009]在一种可能的实施方式中,在对第二磁盘中不可修复的异常数据进行隔离时,具体可以是对第二磁盘中不可修复的异常数据添加异常标识,该异常标识可以用于指示数据重建过程中跳过对不可修复的异常数据进行重建。如此,在对更换磁盘进行数据重建时,当第二磁盘中存在具有异常标识的异常数据时,可以在更换磁盘上跳过对相应数据的重建,具体可以是跳过对该异常数据所属条带在更换磁盘上的数据重建,而可以在更换磁盘上继续重建下一条带的数据。
[0010]在一种可能的实施方式中,在对第二磁盘中不可修复的异常数据添加异常标识时,具体可以是将第二磁盘中不可修复的异常数据修改为预设数值,比如,可以是将不可修复的异常数据全部修改为0,或者全部修改为1,或者修改为01010101这种循环变换数据等。当然,预设数值也可以是其它可能的数值,本实施例对此并不进行限定。
[0011]在一种可能的实施方式中,当第二磁盘在经过数据恢复后,仍然存在异常数据时,在对更换磁盘进行数据重建之前,可以对第二磁盘进行自恢复处理,该自恢复处理用于对第二磁盘中仍然存在的异常数据进行恢复。如此,在对更换磁盘进行数据重建之前,可以通过自恢复过程,进一步常识将第二磁盘中存在的异常数据尽可能的恢复,从而可以有益于提高更换磁盘的数据重建效果。
[0012]在一种可能的实施方式中,对第二磁盘进行自恢复处理,具体可以是对第二磁盘进行下电处理后再进行上电处理。如此,当磁盘出现磁头飞行不稳定或者磁盘状态异常时,通过对该磁盘进行上下电处理,有可能会将该磁盘上的异常数据恢复至正常数据。
[0013]在一种可能的实施方式中,在对第二磁盘进行下电以及上电处理时,具体可以是通过电源链接器的目标管脚的断电功能对第二磁盘先进行下电处理,再进行上电处理。如此,可以实现对单个磁盘的上下电过程,而可以不用对整个磁盘阵列进行上下电。
[0014]在一种可能的实施方式中,磁盘阵列中还可以更多的磁盘,如还包括第三磁盘,则在利用第一磁盘中的正常数据对第二磁盘中的异常数据进行恢复时,具体可以是根据第一磁盘中的正常数据以及第三磁盘中的正常数据,通过奇偶校验算法对第二磁盘中的异常数据进行恢复。这样,在RAID5、RAID5E以及RAID6等具有冗余校验的磁盘阵列中,通常其它磁盘上的正常数据可以对存在异常数据的磁盘上数据进行恢复,从而可以使得其他磁盘上的数据能够尽可能多的恢复正常,以便于提高后续对于更换磁盘的重建效果。
[0015]在一种可能的实施方式中,在对更换磁盘进行数据重建之前,当磁盘阵列中同时存在第一磁盘以及第二磁盘发生故障时,也即发生双盘失效时,可以利用磁盘阵列的固件空间第二磁盘恢复至在线状态,该第二磁盘的故障时间晚于第一磁盘的故障时间。这样,磁盘阵列可以由双盘失效状态恢复至单盘失效状态,从而可以在单盘失效状态下对磁盘阵列进行故障恢复。
[0016]在一种可能的实施方式中,磁盘阵列在经过故障恢复后,可以提示经过数据重建后的更换磁盘中的异常数据或磁盘阵列中的异常数据,从而用户可以根据该提示,对更换磁盘中的异常数据进行手动恢复,或者对于磁盘阵列中的异常数据进行相应的数据恢复操作。
[0017]在一种可能的实施方式中,该磁盘阵列具体可以是具有校验冗余机制的RAID,如RAID5、RAID5E以及RAID6等,这些磁盘阵列可以至少具有三个磁盘,并且该磁盘阵列中任意一条条带数据,可以通过每个磁盘上的数据块或者校验数据进行校验恢复。
[0018]第二方面,本申请实施例还提供了一种磁盘阵列故障恢复方法,该磁盘阵列包括第一磁盘以及第二磁盘。当该磁盘阵列中的第一磁盘发生故障时,可以获取该第一磁盘中的正常数据,并利用该第一磁盘中的正常数据,校验第二磁盘中的数据是否存在异常,从而可以充分利用故障磁盘上的有效信息,实现对该故障磁盘上可被读取的数据信息的有效利用,尽可能的校验出第二磁盘上出现的异常数据。
[0019]在一种可能的实施方式中,可以根据经本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种磁盘阵列故障恢复方法,其特征在于,所述磁盘阵列包括第一磁盘以及第二磁盘,所述方法包括:当所述第一磁盘故障时,获取所述第一磁盘中的正常数据;利用所述第一磁盘中的正常数据对所述第二磁盘中的异常数据进行恢复。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据经过数据恢复的第二磁盘中的数据,对所述第一磁盘对应的更换磁盘进行数据重建。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在对所述更换磁盘进行数据重建之前,对所述第二磁盘中不可修复的异常数据进行隔离。4.根据权利要求3所述的方法,其特征在于,所述对所述第二磁盘中不可修复的异常数据进行隔离,包括:对所述第二磁盘中不可修复的异常数据添加异常标识,所述异常标识用于指示数据重建过程中跳过对所述不可修复的异常数据进行重建。5.根据权利要求4所述的方法,其特征在于,所述对所述第二磁盘中不可修复的异常数据添加异常标识,包括:将所述第二磁盘中不可修复的异常数据修改为预设数值。6.根据权利要求2至5任一项所述的方法,其特征在于,所述方法还包括:当所述第二磁盘在经过数据恢复后仍然存在异常数据时,在对所述更换磁盘进行数据重建之前,对所述第二磁盘进行自恢复处理。7.根据权利要求6所述的方法,其特征在于,所述对所述第二磁盘进行自恢复处理,包括:对所述第二磁盘进行下电处理后再进行上电处理。8.根据权利要求7所述的方法,其特征在于,所述对所述第二磁盘进行下电处理后再进行上电处理,包括:通过电源链接器的目标管脚的断电功能对所述第二磁盘进行下电处理后再进行上电处理。9.根据权利要求2至8任一项所述的方法,其特征在于,所述方法还包括:在对所述更换磁盘进行数据重建之前,当所述磁盘阵列同时存在所述第一磁盘以及所述第二磁盘发生故障时,利用所述磁盘阵列的固件控制所述第二磁盘恢复至在线状态,所述第二磁盘的故障时间晚于所述第一磁盘的故障时间。10.根据权利要求2至9任一项所述的方法,其特征在于,所述方法还包括:提示经过数据重建后的更换磁盘中的异常数据或所述磁盘阵列中的异常数据。11.根据权利要求1至10任一项所述的方法,其特征在于,所述磁盘阵列包括具有校验冗余机制的独立硬盘冗余阵列。12.一种磁盘阵列故障恢复方法,其特征在于,所述磁盘阵列包括第一磁盘以及第二磁盘,所述方法包括:当所述第一磁盘故障时,获取所述第一磁盘中的正常数据;利用所述第一磁盘中的正常数据,校验所述第二磁盘中的数据是否存在异常。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括:根据经过数据校验的第二磁盘中的数据,对所述第一磁盘对应的更换磁盘进行数据重建。14.一种计算装置,其特征在于,所述装置应用于磁盘阵列,所述磁盘阵列包括第一磁盘以及第二磁盘,所述装置包括:获取模块,用于当所述第一磁盘故障时,获取...

【专利技术属性】
技术研发人员:洪潮刘尖冯纯硕
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1