【技术实现步骤摘要】
【国外来华专利技术】用于在不可信存储装置中进行差异去重的方法和系统
[0001]本公开内容大体涉及数据保护和备份领域,更具体地,涉及用于对不可信存储装置中的一个或更多个数据块进行差异去重的方法和系统。
技术介绍
[0002]通常,数据备份用于在主存储系统(例如服务器)中发生数据丢失事件时保护和恢复数据。数据丢失事件的示例可以包括但不限于数据损坏、主存储系统中的硬件或软件故障、数据意外删除、黑客攻击或恶意攻击。因此,出于安全原因,单独的备份系统或存储装置被广泛用于存储主存储系统中存在的数据备份。通常,随着时间的推移,由于数据变更或任何新数据会占用传统存储装置中的大量存储空间,存储装置的存储空间被占用。这是不可取的,因为它会导致存储系统性能下降。此外,数据存储成本以及包括存储硬件成本在内的所有相关成本仍然是负担。
[0003]通常,在许多情况下,例如在云环境中,存储装置可能不受信任(即,不可信存储装置)。在这种情况下,写入不可信存储装置的数据被加密。换言之,使用不可信存储装置时,如果在未经加密的情况下存储数据,则可能存在数据泄露的潜在风险。例如,任何第三方或不可信实体也能够读取不可信存储装置(例如,云环境)中的存储数据,因此,对存储在这种不可信存储装置中的数据进行加密,以减少数据安全方面的危害。然而,如果存储的数据为加密形式,这意味着数据无法进一步压缩,并且使用加密密钥会有限制,这又会限制此类常规存储系统(例如,不可信存储装置或备份系统)中的数据缩减量。此外,在此类传统系统中,存在数据去重的问题,因为只有在使用相同加密密钥的情况下才 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于对不可信存储装置(102,302,400)中的一个或更多个数据块(108)进行差异去重的方法(100A),所述方法(100A)包括通过实现以下步骤来执行计算机可读指令:提供数据块的哈希值、一个或更多个相似性哈希值和加密密钥的KeyID;可信服务器(104A)对所述数据块执行第一次压缩和第一次加密;通过执行第一应用编程接口API(106A)的写函数,将已压缩和加密的数据块从所述可信服务器(104A)发送至所述不可信存储装置(102,302,400);所述不可信存储装置(102,302,400)识别存储的已压缩和加密的数据块中具有相同相似性哈希值的类似数据块;通过执行第二应用编程接口API(106B),所述可信服务器(104A)执行对来自所述不可信存储装置(102,302,400)的类似数据块的请求;通过执行所述第二API的读函数,使所述类似数据块的向量从所述不可信存储装置(102,302,400)返回至所述可信服务器(104A);所述可信服务器(104A)解密和解压接收的已压缩和加密的类似数据块;识别已解压的类似数据块之间的相似性;确定已识别的类似数据块中的要用作参考数据块的第一数据块,并且确定所述已识别的类似数据块中的要使用所述参考数据块进行压缩的第二数据块;所述可信服务器(104A)执行第二次压缩,以通过使用所述参考数据块重新压缩所述第二数据块,并且执行第二次加密以重新加密已重新压缩的数据块;通过执行所述第二API对所述不可信存储装置(102,302,400)执行写函数,并且将已重新加密的利用所述参考数据块压缩的第二数据块、所述第二数据块的哈希值、所述参考数据块的哈希值、所述第二数据块的加密密钥的KeyID、所述参考数据块的加密密钥的KeyID从所述可信服务器(104A)发送至所述不可信存储装置(102,302,400);在所述不可信存储装置(102,302,400)中将所述第一次压缩和第一次加密的数据块替换为第二次压缩和第二次加密的数据块,并且获得差异去重数据块。2.根据权利要求1所述的方法(100A),其中,所述方法(100A)还包括定义一组或更多组可信服务器(104),其中,所述一组或更多组可信服务器(104)包括一个或更多个可信服务器(104A
‑
104N)。3.根据权利要求1或2所述的方法(100A),其中,所述方法(100A)还包括通过以下操作对所述差异去重数据块进行解压:执行对所述差异去重数据块的解密,执行对已压缩的参考数据块的解密,执行对已解密的参考数据块的解压,通过使用已解压的参考数据块执行对所述差异去重数据块的解压。4.根据前述权利要求中任一项所述的方法(100A),其中,发送包括发送所述数据块的大小以及所述数据块的哈希值、相似性哈希值和加密密钥的KeyID。5.根据前述权利要求中任一项所述的方法(100A),其中,返回所述向量包括返回所述已压缩和加密的数据块的大小以及所述已压缩和加密的数据块的加密密钥的KeyID、哈希值、一个或更多个相似性哈希值。6.根据前述权利要求中任一项所述的方法(100A),其中,所述返回包括返回具有最大公共相似性哈希值的所述类似数据块。7.一种用于对不可信存储装置(102,302,400)中的一个或更多个数据块(108)进行差
异去重的可信服务器(104A),其中,所述可信服务器(104A)包括被配置成存储指令的存储器(208)和被配置成执行所述指令以进行下列操作的服务器处理器(210):实现第一应用编程接口(106A),用于在所述可信服务器(104A)与所述不可信存储装置(102,302,400)之间执行写函数和读函数;实现第二应用编程接口(106B),用于在所述可信服务器(104A)与所述不可信存储装置(102,30...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。