The invention provides a storage method of a distributed storage system based on a secure reproducing code. The uploaded file is coded in block, before the code is preprocessed, the code is stored in the N storage node. The new node receives the help symbols from other d nodes, and uses the uniqueness of the encoding matrix to determine the equation to perform the inverse operation, and completes the regeneration and repair of the damaged node, and then by accepting the help from the d+1 nodes. By comparing the results of the two regeneration, the symbol is used to detect whether the regenerated node is mistaken, and if there is a mistake, by accepting the help symbols from the 1 nodes of N, the damage node of the help symbol is determined by the redundancy of the help symbol, and the correction is made to restore the regenerative function. The invention realizes the secure access to the storage node and the data repair function through the secure storage, repair and access technology based on the secure regenerated code, which can provide service for the storage, acquisition, sharing and processing of data.
【技术实现步骤摘要】
一种基于安全再生码的分布式存储系统的存储方法
本专利技术涉及大数据的分布式存储及数据修复
,尤其涉及一种基于安全再生码的分布式存储系统的存储方法。
技术介绍
当今世界已步入大数据时代,数据呈现爆炸式的增长,传统的数据存储方式已经不能适应大数据环境下的数据存储。分布式云存储系统的出现和发展,从灵活性、可用性、安全性、稳定性等各个方面满足了大数据环境下新的数据存储需求。但是目前市场上的云存储系统多采取两种方式进行数据分布式存储:1.简单增加文件拷贝数,每个数据中心均存有完整文件拷贝;2.采用reed-solomon码对源文件进行编码,将编码后的文件分割存于不同数据中心。对于方式1来说,其缺点在于存储效率过低,而且必须采用一定的加密算法才能保证数据不被泄漏,而且传统的加密会影响数据传输效率;对于方式2来说,虽然存储效率有一定程度提高,但修复损坏节点以及恢复文件时的带宽占用仍离理论极限差距较大;这两种方式导致整个云存储安全模型不完备,性能不能达到最优、而且安全性较差。然而随着分布式存储系统集群的扩张和云存储的广泛应用,冗余编码逐渐应用于分布式存储系统中保证数据的可靠性,减少了存储容量和存储成本。常用的纠错码有RS码。(n,k)-RS码是一种最大距离可分MDS码,也就是所有数据存储在n个节点中,其中,任意k个节点的数据可以恢复出原始数据。(n,k)-RS保证了最多可失效(n-k)节点而原数据不丢失。而分布式存储系统中,单个节点的失效是常态,多个节点的失效不常见。将RS码应用于分布式存储系统中有几点值得注意:1)RS码修复一个节点的数据所需要的修复带宽远大于该节 ...
【技术保护点】
1.一种基于安全再生码的分布式存储系统的存储方法,其特征在于,将上传文件分成k块,将各分块编码后存到N个存储节点中,每个存储节点存储α个符号,作为文件编码块;在修复故障存储节点的单个文件编码块时,先建立新存储节点,再从所述N个存储节点中选取d个正常存储节点,所述d个正常存储节点各向所述新存储节点发送β个符号进行编码块修复;在重建源文件时,从所述N个存储节点中选取k个正常存储节点,所述k个正常存储节点各向文件请求端发送α个符号进行节点重建。
【技术特征摘要】
1.一种基于安全再生码的分布式存储系统的存储方法,其特征在于,将上传文件分成k块,将各分块编码后存到N个存储节点中,每个存储节点存储α个符号,作为文件编码块;在修复故障存储节点的单个文件编码块时,先建立新存储节点,再从所述N个存储节点中选取d个正常存储节点,所述d个正常存储节点各向所述新存储节点发送β个符号进行编码块修复;在重建源文件时,从所述N个存储节点中选取k个正常存储节点,所述k个正常存储节点各向文件请求端发送α个符号进行节点重建。2.根据权利要求1所述的存储方法,其特征在于,重新生成故障节点的单个文件编码块所需的总带宽为γ=dβ,存储节点参数满足如下关系:其中,α和β为设定值,α表示每个存储节点中所存的符号数,β表示在修复故障节点的单个文件编码块时,从单个正常存储节点下载的符号数;k=(α+β)/β,k表示在重建源文件时需要连接的最少节点数和表示分块数量;d表示修复损坏节点时需要连接的最少节点数;B=kα,B表示上传文件的大小,γ表示在修复故障节点的单个文件编码块时所需的总带宽。3.根据权利要求2所述的存储方法,其特征在于,(1)分块编码前将文件中的B个符号与本地生成的随机序列进行异或运算,如下:s=m+r=[s1,s2,…,sB]其中,m为文件中符号组成的向量,r为本地生成的随机序列符号组成的向量;将s填入两个对称矩阵S1,S2:(2)分块编码矩阵其中,(3)进行分块编码,C=ΨS其中,Ψ为N×d编码矩阵,为d×α数据矩阵,C为N×α码字矩阵;Λ为对角矩阵,Λ=diag[λ1,λ2,…,λα];ρ为有限域GF(q)中的本原元素;(4)分块编码完成后,将C中的1×α向量分别存储于所述N个存储节点中。4.根据权利要求3所述的存储方法,其特征在于,(1)所述d个正常存储节点各向新存储节点z′发送β个符号进行故障节点z的单个文件编码块修复,其中,hi表示正常存储节点,i=1,2,…d,为φz的转置矩阵,T为转置符号,为hi节点上所存的文件编码块,为hi节点生成的帮助符号;(2)故障存储节点中的符号由如下公式得出:新存储节点满足如下关系:其中,为d*1向量,为前一半元素组成的向量,为后一半元素组成的向量,sz由得出。5.根据权利要求4所述的...
【专利技术属性】
技术研发人员:张振江,刘云,李坚,马鸣,雷秋雨,周文彬,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。