创建纠错编码方案的方法和减少数据损失的设备技术

技术编号:2842773 阅读:179 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种用于减少数据损失的方法,所述方法包括第一计算步骤,用于通过分别处理表示纠错编码方案的奇偶校验矩阵的至少两个主对角线上的给定数据集的关联数据信息实体(D)来计算冗余集的每个冗余信息实体(R)的中间结果(T)。所述方法还包括第二计算步骤,用于根据相应的中间结果(T)来计算相应冗余信息实体(R)的信息内容。

【技术实现步骤摘要】

本专利技术涉及一种创建纠错编码方案以减少数据损失的方法。它还涉及减少数据损失的方法、设备、计算机程序产品和计算机程序。它还涉及保护存储在至少一个存储单元处的数据以防不可纠正的介质错误的系统。
技术介绍
存储单元例如基于至少一个磁盘或光盘或固态存储器作为存储介质。随着单个存储单元的存储容量的增加,读取存储在存储单元的至少一个存储介质上的数据时遇到至少一个介质相关的错误的可能性也在增加。当不能通过重新读取所述介质的特定部分来纠正错误时,数据会受到损失。通过存储分布到两个或更多存储单元的冗余数据,可以提高包括所述两个或更多存储单元的系统的可靠性。这种系统被称为独立磁盘冗余阵列(RAID)。已配置RAID的系统主要减少因存储单元的彻底失败而带来的数据损失。US 2005/0108594 A1揭示了一种保护磁盘驱动器上的数据以防不可纠正的介质错误的方法。通过其中将冗余信息扇区与数据信息扇区关联的技术,为已配置RAID的存储系统提供了避免出现不可纠正的介质错误的保护。所述数据信息扇区和所述冗余信息扇区作为单个段被写入单个存储单元。所述冗余信息基于里德-所罗门代码(一种基于异或的代码)或一维奇偶校验。因此,需要提供一种比先前提出的技术更为简单的创建编码方案以减少数据损失的方法。同样,需要提供一种比先前提出的技术更为简单的减少数据损失的方法、设备、计算机程序和计算机程序产品。还需要提供一个比先前提出的技术更为简单和可靠的保护存储在至少一个存储单元上的数据以免出现不可纠正的介质错误的系统。
技术实现思路
根据本专利技术的第一方面的实施例,提供了一种用于创建纠错编码方案以减少数据损失的方法,所述数据包括与具有至少两个数据信息实体的给定数据集关联的具有至少两个冗余信息实体的给定冗余集,根据所述数据集的信息内容来计算所述冗余集的信息内容,所述方法包括以下步骤基本选择步骤,用于选择由基本矩阵表示的基本编码方案,其中每个冗余信息实体由行表示,而每个信息实体由列表示;以及矩阵设置步骤,用于设置具有所述基本矩阵的列的子集的目标矩阵并且用于根据所述基本矩阵来改变列的顺序,直至所述目标矩阵在至少给定程度满足非零元素的给定模式(pattern)。此功能允许构建计算引擎以便计算所述冗余集的所述信息内容,其比先前提出的技术中使用的计算引擎更简单。所述非零元素的给定模式影响所述纠错编码方案的复杂性,由此影响其在所述计算引擎中的实现。所述信息实体可以是一位或字节或存储单元上的扇区或任何其他用于存储或传送或接收信息的适合实体。根据本专利技术的第一方面的优选实施例,所述非零元素的给定模式被选择为包括所述目标矩阵的正方形模式子矩阵的主对角线,所述主对角线具有主要为非零的元素,所述目标矩阵具有的行数和列数等于所述冗余集中的冗余信息实体数。所述非零元素的给定模式因而更为简单和规则并允许更为简单地构建计算引擎。在此方面,所述非零元素的给定模式被选择为还包括与所述目标矩阵的所述正方形模式子矩阵的所述主对角线相邻布置的邻近对角线是有利的,所述邻近对角线的元素被选择成主要为非零。这允许构建计算引擎,以便可以通过利用从所述主对角线的元素计算的中间结果来处理所述邻近对角线的元素。所述计算引擎因而可以更为有效。根据本专利技术的第一方面的其他优选实施例,所述基本矩阵被选择为对于所述基本编码方案的给定汉明距离具有最少的非零元素数、最少的所述数据集中的数据信息实体数以及最少的所述冗余集中的冗余信息实体数。这允许减少用于计算所述冗余集的信息内容的操作数。根据本专利技术的第一方面的其他优选实施例,在所述矩阵设置步骤中,改变所述列的顺序直至列数与所述冗余集中的冗余信息实体数相等的所述目标矩阵的每个方格子矩阵的秩与所述冗余集中的冗余信息实体数相等。这允许恢复最多等于所述冗余集中的冗余信息实体数的连续不可读数据信息实体,也称为“删除部分(erasures)”。由此,可以更加可靠地保护数据以防数据损失并降低数据损失的可能性。根据本专利技术的第一方面的其他优选实施例,所述创建的纠错方案基于分别计算由所述目标矩阵每行中的非零元素表示的所有数据信息实体的信息内容的异或。这允许更为简单和性能更高的纠错编码方案,同时降低了计算冗余集的开销,并且与先前提出的技术相比更容易实现。在此方面,所述基本编码方案基于汉明码或扩展汉明码中的一种编码是有利的。这使得所述纠错编码方案更为可靠。根据本专利技术的第二方面的实施例,提供了一种用于减少数据损失的方法,所述数据包括与具有至少两个数据信息实体的给定数据集关联的具有至少两个冗余信息实体的给定冗余集,根据所述数据集的信息内容通过应用纠错编码方案来计算所述冗余集的信息内容,所述纠错编码方案由奇偶校验矩阵表示,其中每个冗余信息实体由行表示,而所述数据的每个信息实体由列表示,并且所述奇偶校验矩阵的至少两个正方形子矩阵具有元素主要为非零的对角线并具有与所述冗余集中的冗余信息实体数相等的行数和列数,并且表示所述数据集的连续放置的数据信息实体,所述方法包括第一计算步骤,用于通过处理所述至少两个主对角线上的所述数据信息实体来计算所述冗余信息实体的中间结果;以及第二计算步骤,用于根据所述中间结果来计算所述冗余信息实体的信息内容。由于所述奇偶校验矩阵的所述至少两个正方形子矩阵的主对角线具有主要为非零的元素,所以计算所述冗余集的信息内容更为简单。根据本专利技术的第二方面的优选实施例,所述主对角线的元素主要为非零的所述奇偶校验矩阵的至少一个正方形子矩阵还具有元素主要为非零的邻近对角线,并且所述第二计算步骤包括利用所述中间结果来处理相应邻近对角线上的数据信息实体。这允许更有效地计算所述冗余集的信息内容。根据本专利技术的第二方面的其他优选实施例,所述冗余集中的每个冗余信息实体的相应信息内容被计算为由所述奇偶校验矩阵的相应行中的非零元素表示的所述数据集中的所有数据信息实体的相应信息内容的异或。这允许在计算所述冗余集的信息内容时降低开销,导致更高的性能。所述方法还更容易实现。根据本专利技术的第三方面的实施例,提供了一种用于减少数据损失的设备。该设备对应于本专利技术的第二方面的实施例及其优点。根据本专利技术的第四方面的实施例,提供了一种用于保护存储在至少一个存储单元上的数据以防不可纠正的介质错误的系统。所述系统包括包含本专利技术的第三方面的设备和至少一个存储单元。每个信息实体表示所述至少一个存储单元上的扇区。所述系统对应于所述设备及其优点。根据本专利技术的第四方面的优选实施例,所述系统配置为独立存储单元的冗余阵列。所述配置也称为独立磁盘冗余阵列(RAID)。这允许更高的可靠性,特别是在一个存储单元完全失败的情况下。由此通过独立存储单元的冗余阵列提供的盘间冗余以及冗余集提供的盘内冗余减少了数据损失。本专利技术的第三方面的有利的实施例并不限于盘,也可以包括任何其他种类的存储单元。根据本专利技术的第五方面的实施例,提供了一种用于减少数据损失的计算机程序产品,所述计算机程序产品包括包含可由计算机执行的程序指令的计算机可读介质。所述程序指令对应于本专利技术的第二方面的实施例及其优点。根据本专利技术的第六方面的实施例,提供了一种包括程序指令的用于减少数据损失的计算机程序。所述程序指令对应于本专利技术的第二方面的实施例及其优点。附图说明现在通过实例的方式参考附图,这些附本文档来自技高网...

【技术保护点】
一种用于创建纠错编码方案以减少数据损失的方法,所述数据包括与具有至少两个数据信息实体(D)的给定数据集关联的具有至少两个冗余信息实体(R)的给定冗余集,根据所述数据集的信息内容来计算所述冗余集的信息内容,所述方法包括以下步骤:基本选择步骤(S2),用于选择由基本矩阵表示的基本编码方案,其中每个冗余信息实体(R)由行表示,而每个信息实体由列表示;以及矩阵设置步骤(S3),用于设置具有所述基本矩阵的列的子集的目标矩阵(H′)并且用于根据所述基本矩阵来改变列的顺序,直至所述目标矩阵(H′)在至少给定程度上满足非零元素的给定模式。

【技术特征摘要】
EP 2005-10-31 05023797.3;EP 2005-11-14 05110718.31.一种用于创建纠错编码方案以减少数据损失的方法,所述数据包括与具有至少两个数据信息实体(D)的给定数据集关联的具有至少两个冗余信息实体(R)的给定冗余集,根据所述数据集的信息内容来计算所述冗余集的信息内容,所述方法包括以下步骤基本选择步骤(S2),用于选择由基本矩阵表示的基本编码方案,其中每个冗余信息实体(R)由行表示,而每个信息实体由列表示;以及矩阵设置步骤(S3),用于设置具有所述基本矩阵的列的子集的目标矩阵(H′)并且用于根据所述基本矩阵来改变列的顺序,直至所述目标矩阵(H′)在至少给定程度上满足非零元素的给定模式。2.如权利要求1中所述的方法,其中所述非零元素的给定模式被选择为包括所述目标矩阵(H′)的正方形模式子矩阵的主对角线,所述主对角线具有主要为非零的元素,所述目标矩阵(H′)具有的行数和列数等于所述冗余集中的冗余信息实体(R)的数量(r)。3.如权利要求2中所述的方法,其中所述非零元素的给定模式被选择为还包括与所述目标矩阵(H′)的所述正方形模式子矩阵的所述主对角线相邻布置的邻近对角线,所述邻近对角线的元素被选择成主要为非零。4.如任一上述权利要求中所述的方法,其中所述基本矩阵被选择为对于所述基本编码方案的给定汉明距离(dmin)具有最少的非零元素数(nz)、最少的所述数据集中的数据信息实体(D)数(n)以及最少的所述冗余集中的冗余信息实体(R)数(r)。5.如任一上述权利要求中所述的方法,其中,在所述矩阵设置步骤(S3)中,改变所述列的顺序直至列数与所述冗余集中的冗余信息实体(R)数(r)相等的所述目标矩阵(H′)的每个方格子矩阵的秩与所述冗余集中的冗余信息实体(R)数(r)相等。6.如任一上述权利要求中所述的方法,其中所述创建的纠错方案基于分别计算由所述目标矩阵(H′)每行中的非零元素表示的所有数据信息实体(D)的信息内容的异或。7.如权利要求6中所述的方法,其中所述基本编码方案基于以下项中的一项汉明码或扩展汉明码。8.一种用于减少数据损失的方法,所述数据包括与具有至少两个数据信息实体(D)的给定数据集关联的具有至少两个冗余信息实体(R)的给定冗余集,根据所述数据集的信息内容...

【专利技术属性】
技术研发人员:A多拉基亚胡晓宇I伊利亚迪斯ES埃莱夫特里乌
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1