一种数据恢复的方法及设备技术

技术编号:12428700 阅读:112 留言:0更新日期:2015-12-03 13:18
本发明专利技术实施例提供了一种恢复数据的方式,当前处理的数据集合划分为n个数据块,并计算得出数据集合的m个冗余的编码块,所述方法还包括:当所述n个数据块中存在坏块时,分析n个数据块中坏块的损坏数据在坏块中所处的位置;根据分析出的位置,将n个数据块和m个编码块中的每个块按照相同的划分规则划分成h个小块,在n个数据块和m个编码块包含的所有小块中,将在每个数据块和编码块中所处位置相同的小块作为一个子集合;针对一个存在坏小块的子集合,分别使用所属于该存在坏小块的子集合中的未损坏的小块的数据恢复所述子集合中坏小块中被损坏的数据。相应地,本发明专利技术实施例还提供了恢复数据的设备。本发明专利技术实施例可以提高数据存储的可靠性。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,尤其涉及一种数据恢复的方法及设备
技术介绍
随着网络技术的发展,需要处理的数据高速增长,为海量数据提供具备高可靠性及高扩展性的存储对现代企业来说是一个巨大的挑战。为保证数据的可靠性和可用性,通常采用存储多个数据副本的方法,当某个副本由于硬盘、服务器、网络或软件出现故障导致副本不可使用时,由其它副本提供服务。这样就带来一个问题,存储空间利用率极低。以3个副本的数据为例,存储空间利用率只有30%左右。目前主要是一种擦除码(ErasureCode,EC)技术解决存储空间利用率低的问题,该技术将数据集合等分为η个数据块,每个数据块存储该数据集合的一部分数据,然后通过纯异或运算,以及代数域运算计算出该数据集合的m个冗余的编码块,再将这η个数据块和m个编码块分别保存在不同的地方。当上述η个数据块和m个编码块中存在的数据损坏的坏块时,使用未损坏的数据块或编码块进行相关的运算恢复坏块,其中,η和m为大于O的整数。但上述技术中,当坏块的数量大于上述m时,就无法恢复坏块,从而导致数据存储的可靠性低。
技术实现思路
本专利技术实施例提供了一种恢复数据的方法及设备,可以提高数据存储的可靠性。本专利技术第一方面提供一种恢复数据的方法,当前处理的数据集合划分为η个数据块,并计算得出所述数据集合的m个冗余的编码块,所述η和m为大于O的整数,所述方法还可以包括:当所述η个数据块中存在坏块时,分析所述η个数据块中每个坏块的损坏数据在所述每个坏块中所处的位置;根据所述分析出的位置,将所述η个数据块和所述m个编码块中的每个块按照相同的划分规则划分成h个小块,在所述η个数据块和所述m个编码块包含的所有小块中,将在每个数据块和编码块中所处位置相同的小块作为一个子集合,每个子集合包含的存在损坏数据的坏小块的数量小于或等于所述m,所述h为大于I的整数;针对一个存在坏小块的子集合,分别使用所属于该存在坏小块的子集合中的未损坏的小块的数据恢复所述子集合中坏小块中被损坏的数据。结合第一方面,在第一种可能的实现方式中,分别使用所属于该存在坏小块的子集合中的未损坏的小块的数据恢复所述子集合中坏小块中被损坏的数据,包括:获取存在坏小块的子集合中,所属于所述m个编码块中小块的数据,以及所属于所述η个数据块中未损坏的小块的数据;使用所述获取的所述m个编码块中小块的数据和所述η个数据块中未损坏的小块的数据恢复所述子集合中的坏小块中被损坏的数据。结合第一方面,在第二种可能的实现方式中,所述针对一个存在坏小块的子集合,分别使用所属于该存在坏小块的子集合中的未损坏的小块的数据恢复所述子集合中坏小块中被损坏的数据,包括:分析存在坏小块的子集合中坏小块的数量;获取存在坏小块的子集合中,所属于所述m个编码块中的并且和坏小块的数量相同的小块的数据,以及所属于所述η个数据块中的未损坏的小块的数据;使用所述获取的所述m个编码块中小块的数据和所述η个数据块中未损坏的小块的数据恢复所述子集合中的坏小块中被损坏的数据。结合第一方面或第一种可能的实现方式或第二种可能的实现方式,在第三种可能的实现方式中,所述根据所述分析出的位置,将所述η个数据块和所述m个编码块中的每个块按照相同的划分规则划分成h个小块包括:根据所述分析出的位置,将所述η个数据块和所述m个编码块中的每个块按照相同的划分规则以预先设置的大小划分成h个小块,所述预先设置的大小为所述η个数据块存储数据的最小单位和所述m个编码块存储数据的最小单位的公倍数的大小。结合第一方面或第一种可能的实现方式或第二种可能的实现方式,在第四种可能的实现方式中,所述根据所述分析出的位置,将所述η个数据块和所述m个编码块中的每个块按照相同的划分规则划分成h个小块包括:根据所述分析出的位置,将所述η个数据块和所述m个编码块中的每个块按照相同的划分规则以预先设置的大小划分成h个小块,所述预先设置的大小以一个扇区为单位且包括至少一个扇区的大小。本专利技术第二方面提供一种恢复数据的设备,当前处理的数据集合划分为η个数据块,并计算得出所述数据集合的m个冗余的编码块,所述η和m为大于O的整数,所述设备包括:第一分析单元、划分单元和恢复单元,其中:所述第一分析单元,用于当所述η个数据块中存在坏块时,分析所述η个数据块中每个坏块的损坏数据在所述每个坏块中所处的位置;所述划分单元,用于根据所述分析单元分析出的位置,将所述η个数据块和所述m个编码块中的每个块按照相同的划分规则划分成h个小块,在所述η个数据块和所述m个编码块包含的所有小块中,将在每个数据块和编码块中所处位置相同的小块作为一个子集合,每个子集合包含的存在损坏数据的坏小块的数量小于或等于所述m,所述h为大于I的整数;所述恢复单元,用于针对一个存在坏小块的子集合,分别使用所属于该存在坏小块的子集合中的未损坏的小块的数据恢复所述子集合中坏小块中被损坏的数据。结合第二方面,在第一种可能的实现方式中,所述恢复单元包括:第一获取单元,用于获取存在坏小块的子集合中,所属于所述m个编码块中小块的数据,以及所属于所述η个数据块中未损坏的小块的数据;第一恢复子单元,用于使用所述获取的所述m个编码块中小块的数据和所述η个数据块中未损坏的小块的数据恢复所述子集合中的坏小块中被损坏的数据。结合第二方面,在第二种可能的实现方式中,所述恢复单元包括:第二分析单元,用于分析存在坏小块的子集合中坏小块的数量;第二获取单元,用于获取存在坏小块的子集合中,所属于所述m个编码块中的并且和坏小块的数量相同的小块的数据,以及所属于所述η个数据块中的未损坏的小块的数据;第二恢复子单元,用于使用所述获取的所述m个编码块中小块的数据和所述η个数据块中未损坏的小块的数据恢复所述子集合中的坏小块中被损坏的数据。结合第二方面或第一种可能的实现方式或第二种可能的实现方式,在第三种可能的实现方式中,所述划分单元还用于根据所述分析出的位置,将所述η个数据块和所述m个编码块中的每个块按照相同的划分规则以预先设置的大小划分成h个小块,所述预先设置的大小为所述η个数据块存储数据的最小单位和所述m个编码块存储数据的最小单位的公倍数的大小。结合第二方面或第一种可能的实现方式或第二种可能的实现方式,在第四种可能的实现方式中,所述划分单元还用于根据所述分析出的位置,将所述η个数据块和所述m个编码块中的每个块按照相同的划分规则以预先设置的大小划分成h个小块,所述预先设置的大小以一个扇区为单位且包括至少一个扇区的大小。本专利技术第三方面提供一种恢复数据的设备,当前处理的数据集合划分为η个数据块,并计算得出所述数据集合的m个冗余的编码块,所述η和m为大于O的整数,其特征在于,所述设备包括处理器,通信接口,存储器和总线:其中处理器、通信接口、存储器通过总线完成相互间的通信;所述通信接口,用于从存储所述η个数据块的数据和所述m个编码块的数据的存储设备接收所述η个数据块的数据和所述m个编码块的数据;所述存储器中存储一组程序代码,且所述处理器用于调用所述存储器中存储的程序代码,用于执行以下操作:当所述η个数据块中存在坏块时,分析所述η个数据块中每个坏块的损坏数据在所述每个坏块中所处的位置;根据所述分析出的位置,将所述η个数据块和所述m个编码块中的每个块按照相同的划本文档来自技高网...

【技术保护点】
一种数据恢复的方法,当前处理的数据集合划分为n个数据块,并计算得出所述数据集合的m个冗余的编码块,所述n和m为大于0的整数,其特征在于,所述方法包括:当所述n个数据块中存在坏块时,分析每个坏块的损坏数据在对应坏块中所处的位置;根据所述分析出的位置,将所述n个数据块和所述m个编码块中的每个块按照相同的划分规则划分成h个小块,在所述n个数据块和所述m个编码块包含的所有小块中,将在每个数据块和每个编码块中所处位置相同的小块作为一个子集合,每个子集合包含的坏小块的数量小于或等于所述m,所述坏小块是指包含损坏数据的小块,所述h为大于1的整数;针对一个存在坏小块的子集合,分别使用所属于该存在坏小块的子集合中的未损坏的小块的数据恢复所述子集合中坏小块中被损坏的数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:张巍张烽雷晓松项锐
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1