一种多云存储环境下数据的安全分发和修复方法、系统及介质技术方案

技术编号:19437189 阅读:16 留言:0更新日期:2018-11-14 13:21
本发明专利技术提供了一种多云存储环境下数据的安全分发和修复方法、系统及介质,该安全分发和修复方法包括:数据分发步骤:将数据信息分散到多云存储系统中;数据恢复步骤:在需要访问用户数据时,采用数据恢复技术根据获取的数据分片进行用户原数据的恢复;数据修复步骤:当某个公有云数据受损或无法访问时,采用数据修复过程对此节点数据进行修复。本发明专利技术的有益效果是:本发明专利技术具有存储机密性、可靠冗余性、低存储代价、支持单节点受损修复、高修复安全以及低修复代价。

【技术实现步骤摘要】
一种多云存储环境下数据的安全分发和修复方法、系统及介质
本专利技术涉及数据处理
,尤其涉及一种多云存储环境下数据的安全分发和修复方法、系统及介质。
技术介绍
随着互联网技术的发展,数据量呈指数增长,海量数据时代来临。传统的本地存储方案难以满足用户的存储需求,而由于云存储系统具有较低的存储和运维费用,因此得到更广泛的推广和应用。例如,现在很多医疗记录、大型公司的系统信息和用户的金融消费记录等都逐渐向云平台转移。与此同时,一方面由于现在有很多云存储服务商可以选择而又各有特色,而用户更换云存储提供商时也会带来昂贵的成本;另一方面从数据机密性和隐私保护的角度考虑,用户也倾向于不将数据存储于单个云服务提供商中,因此,多云存储系统得到越来越广泛的研究和应用。多云存储系统是采用数据分发技术将文件分为多份,然后分发到多个云服务提供商中,利用多种云服务商提供的存储平台协同进行数据存储。虽然相比于单云存储系统,多云存储系统在数据迁徙代价、可用性能上都有较大提升,但由于数据完全存储在云端服务器上,脱离了用户掌控,也会存在问题。首先是数据的可用性问题。很有可能因为某个或某几个服务商的网络链路的不可靠性或者服务器宕机,导致用户数据分片的丢失或不可访问。我们希望一个好的多云存储方案能够抵抗一定数量的系统错误而维持数据的可用性。其次是数据的机密性问题。虽然服务器提供商也许是可信的,但其内部的管理员可能会泄露用户数据给他人,并从中获取利益,侵害了用户隐私。在多云存储系统中,当存在移动的攻击者对多个云服务商同时攻击或者服务商之间勾结,同样会产生用户数据机密泄露的威胁,虽然相比单云系统要小得多。最后是数据的存储和修复代价问题。数据存储在多云存储系统中,通常希望能够尽量实现存储代价的最小化,但有可能会影响到数据的可用性;而另一方面,由于云存储系统中设备失效经常发生,为了系统中数据的可用性和完整性,需要对受损的存储节点迅速进行修复。此时在修复时如何保证修复过程的安全性,即在数据修复过程中不泄露用户数据信息,以及降低单个节点的修复代价,也是多云存储系统在设计时需要考虑的因素之一。而多云存储系统的多种性能除了依赖于各个云服务提供商内部的访问控制和数据保护协议外,更与系统采用的数据分发方案密切相关。目前多云存储系统中存在多种数据分发算法,当前常用的主要包括纠删码、秘密共享门限编码和局部修复再生码三种,这三种数据分发算法都存在一定的不足之处。其中,纠删码有较高的存储空间利用率,但是存储的机密性不足,数据修复的代价也较高;秘密共享算法有较高的数据存储机密性,可以有效保护数据安全,但是存储和数据修复的代价都较高;再生码具有较低的数据修复代价,且有较高的存储空间利用率,但是数据存储和修复中的机密性较差。因此,如何设计出一个优化的方法,一方面提高系统数据的安全性与可用性,使得用户能更加信任云存储提供商;另一方面可以最小化存储代价和修复代价,一直是多云存储系统中研究的重点问题。与本专利技术相关的
技术介绍
1:一种现有技术针对多云存储系统提出了一种基于门限的数据分发方案。采用一种或者结合多种数据分发算法编码生成数据分片。然后将分片对等地分发到多云存储系统中的云端服务器。在用户恢复拆分的数据文件时,读取各个服务器的数据片,若读取的数据块数目满足数据分发时的门限阈值参数,则可以恢复出用户数据。在此方案中,系统数据的安全性与可靠性仅通过门限来控制,门限值越高,则系统数据被攻击者破译的可能性越小。例如针对一种(n,k)门限编码方法,为了增加系统安全性可以采用增加恢复门限阈值的方法,门限k越大则被攻击的难度越高。然而增加门限值的代价是造成系统数据冗余率n/k的降低,当k=n时,系统中只有一份数据备份,会造成系统可靠性急剧降低。而当算法降低门限参数值,最极端的情况可以取k=1。此时该算法是一种基于副本的分发方案。此时数据冗余度最高为n,却导致任意分片数据泄露都会造成用户数据泄露,数据机密性极低。因此,算法在确定门限阈值k时会存在一个关于系统数据机密性与可用性的权衡关系,此关系所对应的函数的不同取值形成了二维平面坐标系中的一条曲线,曲线的两个端点对应的具有最高存储机密性的系统和有最高数据冗余度的系统。
技术介绍
1的缺点:采用技术一通过门限编码方法在一定程度上保护了多云存储系统中数据的机密性与可用性,但该技术未充分利用多云系统中不同存储节点性质的多样性进行非对等的数据分发,例如私有云与公有云不同的存储特性,以及不同公有云服务商之间的服务差别,导致这些多云系统性能不能实现可靠性与机密性同时最优。与本专利技术相关的
技术介绍
2:一种现有技术采用一种混合的多云存储系统方案,通过可靠云与公共云结合的方式进行数据存储。在存储数据时,对于数据量较小的元数据,为了增加其稳健性,将元数据以复制的方式存储在可靠信任的服务器上,此处可靠信任的服务器主要是本地的私有服务器;对于用户需要存储的文件,采用复制或者编码的方式存储在多云存储系统中的公有云服务器中。此技术在私有云上维护元数据的顺序是依据每个键的字节量,以避免私有云扩展的瓶颈问题,使其能够允许部分云中断问题的发生。
技术介绍
2的缺点:采用技术二利用多云存储系统环境下存储节点的多样性来进行混合的数据分发,将数据量小而重要的元数据存储在私有云上,提升了多云存储系统的可靠性。但是此技术问题在于,虽然私有云的可靠性比公有云高,但是在私有云仍有一定的概率发生存储故障,一旦此数据不可访问或受损,会造成用户数据永久的不可恢复问题。与本专利技术相关的
技术介绍
3:一种现有技术采用一种具有可修复性的多云存储系统数据分发方案,此技术的编码基于功能性修复的再生码(FMSR)实现,可以解决单一节点数据永久性受损问题。当某个存储节点中的数据受损或丢失时,通过获取其他存储节点数据,经过代理服务器的计算对受损节点进行修复,而不需要恢复完整的原文件后再对受损节点重新编码分发。
技术介绍
3的缺点:采用技术三利用再生码的修复特性可以保证较低的修复带宽,减少修复成本,同时实现与普通MDS码(例如RAID-6)同样的容错率。但是,此系统存在两方面的问题。一方面,需要额外的代理服务器做数据修复,维护代价较高;另一方面,此系统主要针对修复代价和成本问题的解决,并未考虑修复过程的安全性。
技术实现思路
本专利技术提供了一种多云存储环境下数据的安全分发和修复方法,包括如下步骤:数据分发步骤:将数据信息分散到多云存储系统中;数据恢复步骤:在需要访问用户数据时,采用数据恢复技术根据获取的数据分片进行用户原数据的恢复;数据修复步骤:当某个公有云数据受损或无法访问时,采用数据修复过程对此节点数据进行修复。本专利技术还提供了一种多云存储环境下数据的安全分发和修复系统,包括:存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序配置为由所述处理器调用时实现本专利技术所述的方法的步骤。本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现本专利技术所述的方法的步骤。本专利技术的有益效果是:本专利技术具有如下技术优势:存储机密性、可靠冗余性、低存储代价、支持单节点受损修复、高修复安全以及低修复代价。附图说明图1是本专利技术的数据分发步骤的流程图。图2是本专利技术的数据恢复步骤的本文档来自技高网
...

【技术保护点】
1.一种多云存储环境下数据的安全分发和修复方法,其特征在于,包括如下步骤:数据分发步骤:将数据信息分散到多云存储系统中;数据恢复步骤:在需要访问用户数据时,采用数据恢复技术根据获取的数据分片进行用户原数据的恢复;数据修复步骤:当某个公有云数据受损或无法访问时,采用数据修复过程对此节点数据进行修复。

【技术特征摘要】
1.一种多云存储环境下数据的安全分发和修复方法,其特征在于,包括如下步骤:数据分发步骤:将数据信息分散到多云存储系统中;数据恢复步骤:在需要访问用户数据时,采用数据恢复技术根据获取的数据分片进行用户原数据的恢复;数据修复步骤:当某个公有云数据受损或无法访问时,采用数据修复过程对此节点数据进行修复。2.根据权利要求1所述的安全分发和修复方法,其特征在于,在所述数据分发步骤中,包括如下步骤:加密文件步骤:针对用户需要上传的文件,生成随机密钥完成数据加密;密文采用RC码编码拆分步骤:针对通过AES加密后产生的密文E,采用再生码(r,k,d1)RC的编码方式,得到密钥采用R-SS码编码拆分步骤:针对存储量较少的密钥S,采用结合再生码的秘密共享修复算法R-SS编码处理;分发步骤:分发数据到服务器端。3.根据权利要求1所述的安全分发和修复方法,其特征在于,在所述密文采用RC码编码拆分步骤中,首先将密文数据E均等的拆分为k个数据块{{E1,E2,E3...Ek},然后采用一个再生码的生成矩阵GM进行编码,GM有rα行k列,rα个行向量对应着rα个冗余数据块,将生成矩阵GM按行分为r个子矩阵GMi(i=1,2…r),且GM=[GM1,GM2...GMk]T,将每个子矩阵GMi与密文原始数据块(E1,E2...Ek)相乘编码,得到存储节点i的α个冗余数据块,Ci=(E(i-1)α+1...Eiα)=GMi*E,生成最终的r个冗余分片{C1,C2,C3...Cr};在所述密钥采用R-SS码编码拆分步骤中,先用(t,t)shamir秘密共享将密钥S无密钥编码为t份,ysub={y1,y2,y3...yt},然后,对Ssub中的t份数据块,使用(m,t,d2)的再生码进行数据分拆,其中,再生码的生成矩阵为SM,SM有mα行t列,包含m个子矩阵SMi(i=1,2…m),SM=[SM1,SM2,...SMm]T,将每个子矩阵SMi与密钥S的通过秘密共享编码后构成的矩阵(y1,y2,y3...yt)相乘,获取存储节点i的α个冗余数据块,Si=SMi*ysub,得到最终的m个冗余的数据分片{S1,S2,S3…Sm};在所述分发步骤中,将通过编码得到的数据Bi={Si,Ci},分发到各个公有云存储服务器Pi{i=1,2…r}中,将密钥分片Bx={Sr+1,Sr+2,...Sr+x}保存在私有服务器Pr中,最后将密钥分片Bw={Sr+X+1,Sr+X+2...Sr+x+w}保存在用户的hp-sever中。4.根据权利要求1所述的安全分发和修复方法,其特征在于,所述数据恢复步骤包括依次执行如下步骤:首先,进行用户身份验证,然后查找数据的元文件,确定数据结构参数;用户访问hp-sever,获取w份密钥分片Bw={Sr+x+1,Sr+x+2...Sr+x+w};判断hp-share数据是否丢失,若hp-share数据丢失,那么访问r个公有云服务器和私有云服务器获取数据;若hp-share数据未丢失,那么用户再访问私有云Px获取密钥数据分片Bx={Sr+1,Sr+2...Sr+x},判断私有云数据是否丢失,若未丢失,那么用户需访问t-w-x个公有云服务器获取数据集{B1,B2...Bt-w-x},其中Bi={si,Ci},否则,用户访问t-w个公有云服务器获取数据集{B1,B2...Bt-w};若用户数据丢失,则此时为了进行数据恢复,所需要的授权子集Csub={B1,B2...Bx},通过授权子集Csub中所获取的密文分片集合{C1,C2,C3...Ck},采用再生码进行数据恢复,从授权子集中提取密文数据构成数据分片矩阵C,并通过矩阵相乘解码得到用户数据的密文E,然后利用拉格朗日插值公式,得到密钥S,最后,利用AES解密算法,通过编码得到的密文E,与秘密共享得...

【专利技术属性】
技术研发人员:李大刚孙书豪周颖
申请(专利权)人:北京大学深圳研究生院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1