The invention discloses a method, system and device for data de-duplication based on storage gateway, which includes: the storage gateway calculates the summary of the file to be uploaded and sends the summary to the server so as to enable the server to issue a challenge instruction for privilege verification or file upload instruction; the storage gateway generates a response array according to the challenge instruction for server privilege verification to enable the server to carry out privileges. Verification; Storage Gateway uploads files to the server according to the file upload instructions of the server, combined with obfuscated files; Server receives summaries of files to be uploaded sent by the storage gateway; Server repeatedly checks the summaries of uploaded files to generate file upload instructions or authority verification challenge instructions; System includes storage gateway and server; Device includes storage gateway and server. Memories and processors. The invention greatly reduces the workload of users and has high security, and can be widely used in the field of cloud computing technology.
【技术实现步骤摘要】
一种基于存储网关的数据去重方法、系统及装置
本专利技术涉及云计算
,尤其是一种基于存储网关的数据去重方法、系统及装置。
技术介绍
近年来,随着云计算技术的快速发展,越来越多的用户使用云存储服务存储和管理数据,因此造成大量冗余数据。为了节省存储空间和网络带宽的消耗,研究者们提出数据去重(deduplication)技术,也被称为重复数据删除技术。利用该技术,消除了云存储中冗余的文件或更细粒度的数据,云存储服务器只需保留一份数据副本。数据去重技术根据去重发生的位置可分为:客户端数据去重和服务器端数据去重。在客户端数据去重方案中,用户首先上传文件标识(如hash值)至服务器中进行重复检测,若存在重复,则无需重复上传该文件,并且服务器将该用户记为文件拥有者。在服务器端数据去重方案中,用户不管文件是否重复,总是将文件上传至服务器,随后服务器检测文件的重复性,并将重复文件删除,仅保留一份数据副本。显然,服务器端数据去重需要消耗更多的网络带宽,因此客户端数据去重是目前云服务提供商(CSP,CloudServiceProvider)普遍采用的方法。由于典型的客户端数据去重云系统常采用文件的摘要(即hash值)作为用户的文件凭证,由此带来一个问题,即攻击者可能仅凭借文件的摘要就可以获得整个文件,例如攻击者只需上传摘要H(F)就会被云服务器认为拥有文件F的权限。针对于此,研究者们提出了所有权证明(PoW,ProofofOwnership)的概念,用户必须通过云服务器的验证才能拥有相关文件的权限。PoW方案通常包括四个阶段:文件上传(upload)、云服务器发起挑战(ch ...
【技术保护点】
1.一种基于存储网关的数据去重方法,其特征在于:包括以下步骤:存储网关计算待上传文件的摘要并将摘要发送至服务器,以使服务器发出权限验证挑战指令或者文件上传指令;存储网关根据服务器的权限验证挑战指令生成响应数组,以使服务器进行权限验证;存储网关根据服务器的文件上传指令,结合混淆文件将待上传文件上传至服务器。
【技术特征摘要】
1.一种基于存储网关的数据去重方法,其特征在于:包括以下步骤:存储网关计算待上传文件的摘要并将摘要发送至服务器,以使服务器发出权限验证挑战指令或者文件上传指令;存储网关根据服务器的权限验证挑战指令生成响应数组,以使服务器进行权限验证;存储网关根据服务器的文件上传指令,结合混淆文件将待上传文件上传至服务器。2.根据权利要求1所述的一种基于存储网关的数据去重方法,其特征在于:所述存储网关计算待上传文件的摘要这一步骤,包括以下步骤:存储网关获取用户上传的待上传文件;存储网关对待上传文件的摘要进行计算,所述摘要的计算公式为:hf=H(F),其中,hf代表待上传文件F的摘要,H()代表散列函数。3.根据权利要求1所述的一种基于存储网关的数据去重方法,其特征在于:所述存储网关根据服务器的权限验证挑战指令生成响应数组,以使服务器进行权限验证这一步骤,包括以下步骤:根据服务器的权限验证挑战指令,存储网关基于待上传文件生成响应数组,所述响应数组包括若干个数据块摘要;存储网关将响应数组发送至服务器,以使服务器对响应数组进行比对后得到权限验证挑战结果;存储网关接收服务器的权限验证挑战结果,对第一权限集合进行更新;存储网关在经过预设的第一时间后,将待上传文件删除。4.根据权利要求1所述的一种基于存储网关的数据去重方法,其特征在于:所述存储网关根据服务器的文件上传指令,结合混淆文件将待上传文件上传至服务器这一步骤,包括以下步骤:存储网关将待上传文件和待上传文件的摘要加入上传队列;判断上传队列中是否存在混淆文件,若是,则直接执行下一步骤;反之,则通过存储网关生成虚拟数据加入到上传队列后,再执行下一步骤;存储网关在预设的第二时间之内将上传队列的内容上传至服务器。5.一种基于存储网关的数据去重方法,其特征在于:包括以下步骤:服务器接收存储网关发送的待上传文件的摘要;服务器对待上传文件的摘要进行重复检查,判断所述待上传文件的...
【专利技术属性】
技术研发人员:柳毅,王平雁,李进,梁若涵,谭陆元,
申请(专利权)人:广东工业大学,广州大学,天讯瑞达通信技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。