一种基于纠删码的数据块重建方法技术

技术编号：11210406 阅读：69 留言：0更新日期：2015-03-26 19:51

一种基于纠删码的数据块重建方法，属于计算机存储技术领域，解决现有数据块修复方法需要传输大量数据的问题，以减少重建数据的传输量。本发明专利技术包括数据分块步骤、构造生成矩阵G步骤、生成校验块步骤、检查数据块状态步骤、构造修复矩阵步骤和修复数据块步骤。本发明专利技术将原始文件分为k个数据块，将每个数据块继续等分为r个数据片；k个数据块编码为m个校验块，每个校验块也包含r个校验片。重建任意一个数据块时，从剩余的每个数据块的r个数据片和校验块的r个校验片中取r/m片(该方法保证r被m整除)，从而重建一个数据块只需要总量(m+k-1)r/m的数据片，相对里德-所罗门编码重建一个数据块的数据量，有了明显的减少。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机存储
，具体涉及，可减少重建数据传输。
技术介绍
从RAID(独立硬盘冗余阵列）到分布式存储系统，纠删码广泛应用于存储系统中，用于防止部分数据丢失或数据服务器宕机导致的数据不可访问。纠删码是一种数据保护的编码方法，它首先将原始数据分为等大的数据块，然后再将数据块编码为校验块。当若干个数据块或校验块丢失时，纠删码技术保证原始数据仍然可以恢复。传统的编码方法将原始数据等分为k份数据块，编码生成m份校验块并将它们存储在k+m个不同的存储节点。存储节点是存储设备的逻辑抽象，既可以是一个磁盘也可以是一个存储服务器。所有（k+m)块数据块和校验块中的任意k块都可以重建出k个数据块。但是这类纠删码也面临着一个修复带宽问题：重建一个数据块需要该数据块大小的k倍磁盘I/O和网络流量，占用大量的存储资源和网络资源。以（n，k)里德-所罗门编码为例，η是数据块和校验块的总个数，k是数据块个数，m = n-k是校验块个数。当使用（n，k)里德-所罗门编码对数据量为M的文件进行编码时，首先将文件等分为k个数据块：DpDp. .. ，每个数据块大小为M/k，接着计算生成矩阵和k个数据块的乘积（计算基于有限域），得到m个校验块CtlX1、…、Clrt，每个校验块大小也是M/k。（n，k)里德-所罗门编码的生成矩阵是一个基于有限域GF(2W)的m行k列的矩阵，该矩阵可以是变换后的范德尔蒙德矩阵（Vandermonde matrix)，也可以是柯西矩阵（Cauchy matrix)。当...
一种<a href="http://www.xjishu.com/zhuanli/55/201410717059.html" title="一种基于纠删码的数据块重建方法原文来自X技术">基于纠删码的数据块重建方法</a>

【技术保护点】
一种基于纠删码的数据块重建方法，包括数据分块步骤、构造生成矩阵G步骤、生成校验块步骤、检查数据块状态步骤、构造修复矩阵步骤和修复数据块步骤，其特征在于：(1)数据分块步骤：将数据量为M的原始文件等分为k个数据块Dj，j＝0、...、k‑1，再将k个数据块分别保存在k个数据节点上，进而将各数据节点上的数据块Dj等分为r个数据片Dj，p，p＝0、...、r‑1，r＝mk‑1，k≥2，m≥2；等分过程中不足部分用0补齐并记录不足数据块或数据片的长度；对所有数据片赋予序号，数据片Dj，p为第j×r+p+1个数据片；(2)构造生成矩阵G步骤：生成矩阵G是m行、k列的分块矩阵，包括m×k个子矩阵Gi，j：G0,0G0,1...G0,k-1G1,0G1,1...G1,k-1............Gm-1,0Gm-1,1...Gm-1,k-1,]]>其中，每个子矩阵Gi，j为一个r行、r列的方阵，满足下面等式：Gi,j=(Imi+)⊗j⊗(Im)⊗(k-1-j)·αi,j,]]>i＝0～m‑1，j...

【技术特征摘要】
1. 一种基于纠删码的数据块重建方法，包括数据分块步骤、构造生成矩阵G步骤、生成校验块步骤、检查数据块状态步骤、构造修复矩阵步骤和修复数据块步骤，其特征在于： (1) 数据分块步骤：将数据量为M的原始文件等分为k个数据块j=O.....k-1，再将k个数据块分别保存在k个数据节点上，进而将各数据节点上的数据块Dj等分为r个数据片Dj>p，p=O..... r-1，r=k多2,m多2 ;等分过程中不足部分用O补齐并记录不足数据块或数据片的长度；对所有数据片赋予序号，数据片Ip为第jXr+ρ+Ι个数据片； (2) 构造生成矩阵G步骤：生成矩阵G是m行、k列的分块矩阵，包括mXk个子矩阵Gi, j:其中，每个子矩阵G._ 为一个r行、r列的方阵，满足下面等式：其中，(g表示矩阵的张量乘（也称为Kronecker乘），I111表示m行、m列的单位矩阵，/= 表示单位矩阵Im所有元素循环左移i位后的结果，当i= 〇时，=/m，（tf表示j 个G连续张量乘的结果，αμ是（m+k，k)_里德-所罗门编码生成矩阵中第i行第j列元素； (3) 生成校验块步骤：分别计算生成矩阵G中各行子矩阵和所有数据块的乘积，得到m个校验块Ci,i= 0?m-Ι，再将m个校验块分别保存在m个数据节点上，第i个校验块Ci为生成矩阵G的第i行子矩阵与k个数据块的乘积：校验块(^再等分为r个校验片CiP，p= 0?r-Ι;对所有校验片赋予序号，校验片Cj,P为第iXr+ρ+Ι个校验片； (4) 检查数据块状态步骤：定期依次检查各数据节点上的数据块是否出错或丢失，是则转步骤（5);否则不作处理； (5) 构...

【专利技术属性】
技术研发人员：冯丹，柳青，施展，李剑，欧阳梦云，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人