The invention discloses a local node repair method based on the minimum bandwidth regeneration code of complete graph. The implementation steps are: constructing the minimum bandwidth regeneration code of complete graph, dividing nodes in distributed storage system into several repair groups, constructing the minimum bandwidth regeneration code of complete graph in each repair group, packing the data to be stored in blocks and encoding and storing them in each repair group. When a single node fails in a distributed storage system, the surviving node in the repair group where the new node connects the failed node can be repaired. The invention can repair a single failed node in a distributed storage system, reduce the repair bandwidth overhead and disk I/O overhead in the repair process of the node, and the repair process does not require coding and decoding operation, thus improving the repair efficiency.
【技术实现步骤摘要】
基于完全图最小带宽再生码的局部性节点修复方法
本专利技术属于计算机
,更进一步涉及分布式存储
中的一种基于完全图最小带宽再生码的局部性节点修复方法。本专利技术可以应用于分布式系统、数据库等领域,在分布式存储系统发生单节点失效时,新节点连接修复组内的存活节点实现失效节点数据的局部性修复。
技术介绍
分布式存储系统通过修复失效节点数据来维护系统的可靠性,如何减少因为节点失效而产生的修复数据量,提高失效节点修复的局部性是分布式存储系统需要面对的关键问题。为了降低修复失效节点产生的带宽开销,Dimakis等人通过将分布式存储系统中的节点修复问题抽象成通信网络中的单源多播问题进行分析,得出存储-带宽开销权衡曲线,并首次提出再生码的概念,对应该曲线的2个特殊点,分别是最小存储再生MSR(minimumstorageregenerating)码与最小带宽再生MBR(minimumbandwidthregenerating)码。再生码在故障节点修复时,只关注修复带宽开销和存储开销,没有考虑磁盘I/O开销,磁盘I/O开销是分布式存储系统数据修复的又一性能瓶颈。磁盘I/O开销与失效节点修复过程中连接的存活节点数目成正比,连接的存活节点数目越少,节点修复局部性越好,磁盘I/O开销越小。北京大学深圳研究生院在其申请的专利文献“一种最小带宽再生码的编码和存储节点修复方法”(专利申请号:201380001964.1,授权公告号:CN103688515B)中公开了一种最小带宽再生码的编码和存储节点修复方法。该方法将大小为B的原始数据平均分为k(k+1)/2个数据块,得到第一 ...
【技术保护点】
1.一种基于完全图最小带宽再生码的局部性节点修复方法,其特征在于,将分布式存储系统中的节点划分为多个修复组,在各个修复组内构造完全图最小带宽再生码,将待存储数据分块打包并在各个修复组内编码存储,新节点连接失效节点所在修复组内的存活节点即可完成修复,该方法的步骤包括如下:(1)构造完全图最小带宽再生码:生成一个由三个参数(n,k,d)构成的完全图最小带宽再生码,其中,n表示分布式存储系统的节点数,n≥5;k表示数据收集者重建所存储的数据需要连接的最少节点数,2≤k≤n‑1;d表示新节点在节点修复过程中连接的存活节点数,d=n‑1;(2)将分布式存储系统中的节点划分为多个修复组:(2a)对分布式存储系统的每个节点编号;(2b)以n1为间隔,将分布式存储系统中的节点均分为t个修复组,将t个修复组的最后一组与剩余节点组成修复组λ,其中,n1表示t‑1个修复组中每个修复组内的节点个数,n1≥5;(3)在各个修复组内构造完全图最小带宽再生码:(3a)对t‑1个修复组中的每个修复组,生成参数为(n1,k1,d1)的完全图最小带宽再生码,其中,k1表示数据收集者重建每个修复组内所存储的数据需要连接的最 ...
【技术特征摘要】
1.一种基于完全图最小带宽再生码的局部性节点修复方法,其特征在于,将分布式存储系统中的节点划分为多个修复组,在各个修复组内构造完全图最小带宽再生码,将待存储数据分块打包并在各个修复组内编码存储,新节点连接失效节点所在修复组内的存活节点即可完成修复,该方法的步骤包括如下:(1)构造完全图最小带宽再生码:生成一个由三个参数(n,k,d)构成的完全图最小带宽再生码,其中,n表示分布式存储系统的节点数,n≥5;k表示数据收集者重建所存储的数据需要连接的最少节点数,2≤k≤n-1;d表示新节点在节点修复过程中连接的存活节点数,d=n-1;(2)将分布式存储系统中的节点划分为多个修复组:(2a)对分布式存储系统的每个节点编号;(2b)以n1为间隔,将分布式存储系统中的节点均分为t个修复组,将t个修复组的最后一组与剩余节点组成修复组λ,其中,n1表示t-1个修复组中每个修复组内的节点个数,n1≥5;(3)在各个修复组内构造完全图最小带宽再生码:(3a)对t-1个修复组中的每个修复组,生成参数为(n1,k1,d1)的完全图最小带宽再生码,其中,k1表示数据收集者重建每个修复组内所存储的数据需要连接的最少节点数;d1表示新节点在每个修复组内节点修复过程中连接的存活节点数;(3b)在修复组λ内构造参数为(n2,k2,d2)的完全图最小带宽再生码,n2表示修复组λ内的节点个数;k2表示数据收集者重建修复组λ内所存储的数据需要连接的最少节点数;d2表示新节点在修复组λ内节点修复过程中连接的存活节点数;(4)将待存储数据分块打包并在各个修复组内编码存储:(4a)将待存储的数据均分为M个数据块,以B1为间隔,将M个数据块均分为与修复组数量相等的t个数据包,将t个数据包的最后一个与剩...
【专利技术属性】
技术研发人员:肖嵩,孙沃,赵一民,李黎钊,干红平,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。