一种基于用户感知的高效安全数据去重方法及系统技术方案

技术编号:12053974 阅读:148 留言:0更新日期:2015-09-16 18:07
本发明专利技术提供了一种基于用户感知的高效安全数据去重方法,包括:客户端采用密钥服务器协助的基于哈希的收敛加密进行跨用户文件级数据去重;若文件不重复采用用户协助的收敛加密进行用户内部的块级去重;采用多级密钥管理,使用文件级密钥加密块级密钥,使用秘密共享将文件级密钥切分成分片级密钥存储到分布式密钥服务器。本发明专利技术还提供了一种基于用户感知的高效安全数据去重系统。本发明专利技术通过在文件级采用密钥服务器协助的基于哈希的收敛加密和在块级采用用户协助的收敛加密添加随机信息,使用户文件级和块级密钥随机化,能有效地抵抗敌手的暴力破解攻击,保证用户数据机密性和安全性;采用多级密钥管理方案保证密钥安全性,减少密钥空间开销。

【技术实现步骤摘要】

本专利技术属于计算机存储领域,更具体地,设及一种基于用户感知的高效安全数据 去重方法及系统。
技术介绍
近年来,随着云计算的快速发展,越来越多的用户和企业将他们的数据备份到云 存储。IDC预计,到2020年,全球电子数据的规模将超出预期,达到44ZB。最近大量的研 究和调查结果显示,存储系统,特别是备份系统中不同用户之间和用户内部都存在大量的 重复数据。在线数字内容的增长导致了硬件、人力维护在内的存储系统成本的增加,减少传 输、存储管理过程中的数据量变得极其重要。云备份系统通常存储和操作同一数据的若干 副本,该些冗余数据占用了大量的存储空间。数据去重技术是一种通过大规模消除冗余数 据,降低存储成本节约传输带宽的重要技术,因此已经逐渐被诸如,Dropbox,SpiderOak,和 Mozy等云存储和云备份提供商使用。总的来说,数据去重技术通过只保存数据的一个物理 版本,其他的重复数据通过索引来指向的方式消除冗余数据。数据去重技术可W在不同的 粒度实现:一个文件(如;文件级去重),或者细粒度的数据块(如;块级去重)。细粒度的 块级去重应用更加广泛,因为它能使系统更加灵活和高效。 为了保护数据的机密性,用户通常会使用它们自己的密钥加密数据使得数据随机 化,该将导致无法进行数据去重。具体而言,相同的数据被用户采用不同的密钥加密会生成 不同的密文,该样就不存在重复数据。在不同的用户之间共享密钥开销很大且存在信息泄 露的隐患,该是因为如果其中一个用户的密钥泄露,就会导致其他用户的数据泄露。因此, 在云备份系统中,如何保证数据的安全性是跨用户细粒度的数据去重面临的主要问题。现 有前言的安全数据去重方法是使用确定化的加密,称为收敛加密。收敛加密使用数据的哈 希值作为密钥来加密数据。相同的数据会生成相同的密文,使得我们可W在密文上做数据 去重。 然而,收敛加密也带来了新的挑战和问题。第一,在基于细粒度数据去重去重的 方案中,收敛加密要么遭受到暴力破解攻击,或者会产生巨大的计算开销。具体而言,由 于加密方式的确定化和密钥的确定化问题(密钥来自数据内容),收敛加密遭受到暴力破 解攻击。暴力破解攻击是,如果敌手知道用户数据M的密文C来自某个特定的集合S= (Ml,…,M。}(集合S的大小为n)。敌手就可W通过线下加密的方式从集合S中恢复明文M。 具体而言,对于集合S中的每一个元素Mi,使用收敛加密方案对Mi生成密文。,并对比验证 。是否等于密文C。为了解决暴力破解攻击的问题,Bellare等人提出了DupLESS,DupLESS 的密钥密钥服务器协助的基于内容的密钥使得密钥随机化,密文也会随机化来抵抗暴力破 解攻击。且用户通过RSA-0PRF协议连接密钥服务器。DupLESS方式只适合文件级去重,对 于块级去重存在巨大的计算开销。第二,前沿的收敛密钥管理方案存在很多的局限性,包括 巨大的密钥空间开销和单点故障。在跨用户细粒度的数据去重中,由于不同用户之间存在 大量的共享数据块,为保证每个用户的数据恢复,每个用户需保存数据块的密钥,该导致密 钥的存储空间随共享用户数和共享的数据块数量线性增长。同时,为保证密钥的安全性,用 户通常会使用自己的私钥加密数据块的密钥,使得用户私钥存在单点故障问题。
技术实现思路
针对现有技术的W上缺陷或改进需求,本专利技术提供了一种基于用户感知的多级密 钥管理的细粒度高效安全数据去重方法,其目的在于保证在用户数据机密性,安全性和数 据去重压缩率的前提下,利用重复数据在不同用户,在文件和数据块的分布来减少安全措 施带来的计算和时间开销,提高云备份系统性能。同时,我们的方案和系统也保证密钥的 安全性和可靠性,减少密钥的存储空间开销。 为实现上述目的,按照本专利技术的一个方面,提供了一种基于用户感知的高效安全 数据去重方法,包括如下步骤: (1)准备阶段,系统初始化参数,包括初始化公共安全参数P、化amir秘密共享的 参数(W,t),生成密钥服务器的RSA公钥(N,e)、私钥(N,d),初始化哈希函数化sh,带密钥 的哈希函数HMAC和加密函数化cry,并且每个用户产生自己的安全秘密salt,密钥服务器 获得RSA私钥(N,d),将公钥饥e)分发给所有用户;[000引 似备份阶段,包括W下步骤: (2. 1)用户输入文件F,产生文件哈希电二化sh化F),用户对文件哈希HF采用密 钥服务器协助的基于哈希的收敛加密,产生文件级密钥Kp和文件指纹TP,并将文件指纹Tp 发送到存储服务提供商; (2. 2)存储服务提供商接收用户发送的文件指纹Tp,在文件指纹索引中查找文件 指纹Tp是否存在,并将查询结果返回用户; (2.3)用户接收查询结果;若查询结果显示文件指纹Tp存在,则用户更新文件元 数据信息,备份阶段结束;若查询结果显示不存在,则用户将文件F切分成细粒度的数据 块,并在用户内部执行块级去重; (2.4)在用户内部的块级去重中,对于每个数据块町采用用户协助的收敛加密算 法获得数据块町的加密密钥Kg和数据块的指纹写,,将所有数据块的指纹{马,)发送到存储 服务提供商端进行重复数据检测,其中z' =l,2,,u.,n是数据块数目;[001引 (2. 5)存储服务提供商接收用户发送的数据块指纹{Tb,},并在用户的块级指纹索 引表中对所有的数据块指纹{Tb,}进行查询;对于每一个数据块巧J,将所有的数据块的查 询结果写入到标识信息数组中,并将数据块指纹是否存在的标识信息数组返回用户; (2. 6)用户接收存储服务提供商发送的标识信息数组;针对每一个数据块町,若标 识信息数组显示数据块指纹不存在,用户将数据块的密文Cg,.发送到存储服务提供商;用户 生成相应的文件谱并按顺序将数据块的指纹写入到文件谱中用于文件恢复; (2. 7)若标识信息数组显示数据块指纹存在,则用户更新文件谱和元数据信息; 用户使用秘密共享将文件级密钥Kp切分成分片级密钥怯,其中j= 1,2,. . .,W,W是分布 式密钥服务器的数目; (3)恢复阶段,其包括W下步骤: (3. 1)用户要恢复文件F时,将恢复文件请求和文件名发送到存储服务提供商,存 储服务提供商接收用户的文件恢复请求,并验证用户的身份;若身份验证失败,存储服务提 供商拒绝用户的请求,恢复过程结束; (3. 2)若身份验证通过,存储服务提供商读取文件谱,并将文件谱W及文件对应的 所有数据块密文{Cb, }发送给用户;用户接收文件谱和所有数据块的密文{Cb,h (3. 3)用户向t个不同的密钥服务器来获取分片级的密钥Sj.;每个密钥服务器验 证用户的身份,密钥服务器读取分片级密钥Sj.,并将它们发送回该用户;用户使用秘密共 享,根据t个分片级密钥恢复文件F的文件级密钥Kp;其中j= 1,2,. . .,W,W为分布式密 钥服务器数目。 (3. 4)用户获得文件谱和文件级密钥Kp;用户使用文件级密钥Kp根据对称加密 算法来解密每个数据的块级密钥Kg.,并使用对应的数据块块级密钥Ks,来解密每个数据块 Bi;最后按照文件谱的顺序来依次排列数据块并恢复文件F。 按照本专利技术的另一方面,还提供了一种基于用户感知的高效安全数据去重系统, 包括;客户端、存储服务提供商和分布式密本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/62/CN104917609.html" title="一种基于用户感知的高效安全数据去重方法及系统原文来自X技术">基于用户感知的高效安全数据去重方法及系统</a>

【技术保护点】
一种基于用户感知的高效安全数据去重方法,其特征在于,所述方法包括如下步骤:(1)准备阶段,系统初始化参数,包括初始化公共安全参数P、Shamir秘密共享的参数(w,t),生成密钥服务器的RSA公钥(N,e)、私钥(N,d),初始化哈希函数Hash,带密钥的哈希函数HMAC和加密函数Encry,并且每个用户产生自己的安全秘密salt,密钥服务器获得RSA私钥(N,d),将公钥(N,e)分发给所有用户;(2)备份阶段,包括以下步骤:(2.1)用户输入文件F,产生文件哈希HF=Hash(P,F),用户对文件哈希HF采用密钥服务器协助的基于哈希的收敛加密,产生文件级密钥KF和文件指纹TF,并将文件指纹TF发送到存储服务提供商;(2.2)存储服务提供商接收用户发送的文件指纹TF,在文件指纹索引中查找文件指纹TF是否存在,并将查询结果返回用户;(2.3)用户接收查询结果;若查询结果显示文件指纹TF存在,则用户更新文件元数据信息,备份阶段结束;若查询结果显示文件指纹TF不存在,则用户将文件F切分成细粒度的数据块,并在用户内部执行块级去重;(2.4)在用户内部的块级去重中,对于每个数据块Bi采用用户协助的收敛加密算法获得数据块Bi的加密密钥和数据块的指纹将所有数据块的指纹发送到存储服务提供商端,并进行重复数据检测,其中i=1,2,...n,,n是数据块数目;(2.5)存储服务提供商接收用户发送的数据块指纹并在用户的块级指纹索引表中对所有的数据块指纹进行查询;对于每一个数据块将所有的数据块的查询结果写入到标识信息数组中,并将数据块指纹是否存在的标识信息数组返回用户;(2.6)用户接收存储服务提供商发送的标识信息数组;针对每个数据块Bi,若标识信息数组显示数据块指纹不存在,用户将数据块的密文发送到存储服务提供商;用户生成相应的文件谱,并按顺序将数据块的指纹写入到文件谱中用于文件恢复;(2.7)若标识信息数组显示数据块指纹存在,则用户更新文件谱和元数据信息;用户使用秘密共享将文件级密钥KF切分成分片级密钥{Sj},其中j=1,2,...,w,w是分布式密钥服务器的数目;(3)恢复阶段,其包括以下步骤:(3.1)用户要恢复文件F时,将恢复文件请求和文件名发送到存储服务提供商,存储服务提供商接收用户的文件恢复请求,并验证用户的身份;若身份验证失败,存储服务提供商将拒绝用户的请求,恢复过程结束;(3.2)若身份验证通过,存储服务提供商读取文件谱,并将文件谱以及文件对应的所有数据块密文发送给用户;用户接收文件谱和所有数据块的密文(3.3)用户向t个不同的密钥服务器来获取分片级的密钥Sj;每个密钥服务器验证用户的身份,密钥服务器读取分片级密钥Sj,并将它们发送回该用户;用户使用秘密共享,根据t个分片级密钥恢复文件F的文件级密钥KF;(3.4)用户获得文件谱和文件级密钥KF;用户使用文件级密钥KF根据对称加密算法来解密每个数据的块级密钥并使用对应的数据块块级密钥来解密每个数据块Bi;最后按照文件谱的顺序来依次排列数据块并恢复文件F。...

【技术特征摘要】

【专利技术属性】
技术研发人员:冯丹周玉坤夏文付忞黄方亭张宇成李春光
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1