【技术实现步骤摘要】
【国外来华专利技术】基于指纹的数据重复删除
本专利技术一般而言涉及数据存储和数据存储系统中的检索操作,并且更具体地说,涉及为了基于指纹的重复删除的优化而识别块边界。
技术介绍
数据重复删除消除冗余数据,以提高存储利用率并减少经网络发送的数据量。重复删除减少所需的存储容量和网络带宽,这是因为一个独特的数据单元只有一个拷贝被存储和/或发送。基于盘的存储系统,诸如存储管理服务器和卷带库(VTL),可以通过避免这种数据的冗余传送和/或存储来实现检测冗余数据并减少重复的重复删除技术。
技术实现思路
所描述的是计算环境中用于为基于指纹的重复删除的优化而识别块边界的一个专利技术的实施例。在计算环境中备份的存储对象常常是包括许多个别存储对象的合成存储对象。计算环境的计算设备通过对数据范围确定哈希值来把存储对象分成数据块。当到达存储对象的结束时,计算设备创建人工块边界。当为存储对象的数据结束创建人工块边界时,计算设备存储用于该人工块边界的伪指纹。如果哈希值匹配指纹或伪指纹,则计算设备确定该数据范围对应于块并且计算设备定义块边界。人工块边界的伪指纹允许在合成文件中识别人工块边界。因而,基于在伪指纹列表上所存储的伪指纹,计算环境在重复删除过程中更高效地消除冗余数据。例如,用于删除存储对象的重复的计算机实现的方法的一个实施例包括为存储对象的数据窗口确定块识别哈希值并且确定该块识别哈希值是否匹配指纹或存储的伪指纹。另外,该方法确定该数据窗口是否是该存储对象的数据结束。如果确定该数据窗口是该存储对象的数据结束,该方法定义该存储对象中对应于该数据窗口的块的块边界,并且存储该块的块边界。该方法还确定关于存储对象 ...
【技术保护点】
一种用于为了数据重复删除而处理存储对象的计算机实现的方法,包括:为所述存储对象的数据窗口确定块识别哈希值;确定所述数据窗口的所述块识别哈希值是否匹配指纹或存储的伪指纹;当确定所述数据窗口的所述块识别哈希值不匹配所述指纹或所述存储的伪指纹时,确定所述数据窗口是否是所述存储对象的数据结束;当确定所述数据窗口是所述存储对象的所述对象结束时,定义所述存储对象中对应于所述数据窗口的块的块边界并且存储所述块的块边界;及当确定所述存储对象的所述数据窗口是所述存储对象的所述数据结束时,存储所确定的块识别哈希值为所述存储对象中对应于所述数据窗口的所述块的伪指纹。
【技术特征摘要】
【国外来华专利技术】2011.11.28 US 13/305,2181.一种用于为了数据重复删除而处理存储对象的计算机实现的方法,包括:为所述存储对象的数据窗口确定块识别哈希值;确定所述数据窗口的所述块识别哈希值是否匹配指纹或存储的伪指纹;当确定所述数据窗口的所述块识别哈希值不匹配所述指纹或所述存储的伪指纹时,确定所述数据窗口是否是所述存储对象的数据结束;当确定所述数据窗口是所述存储对象的所述对象结束时,定义所述存储对象中对应于所述数据窗口的块的块边界并且存储所述块的块边界;及当确定所述存储对象的所述数据窗口是所述存储对象的所述数据结束时,存储所确定的块识别哈希值为所述存储对象中对应于所述数据窗口的所述块的伪指纹。2.如权利要求1所述的计算机实现的方法,还包括确定关于所述存储对象的所述块的块唯一性哈希并且在用于所述存储对象的所述块的重复删除索引中存储块唯一性哈希信息。3.如权利要求1所述的计算机实现的方法,其中所述确定所述块识别哈希值是否匹配已知的指纹包括确定所述块识别哈希值是否满足预定的数学性质。4.如权利要求1所述的计算机实现的方法,其中存储所述伪指纹包括在伪指纹列表中存储所述伪指纹。5.如权利要求4所述的计算机实现的方法,其中确定所述块识别哈希值是否匹配伪指纹包括确定所述块识别哈希值是否存储在所述伪指纹列表上。6.如权利要求1所述的计算机实现的方法,其中确定所述存储对象的所述数据窗口的所述块识别哈希值包括计算所述存储对象的所述数据窗口的滚动哈希值。7.如权利要求6所述的计算机实现的方法,其中计算所述存储对象的所述数据窗口的所述滚动哈希值包括计算所述存储对象的所述数据窗口的Karp-Rabin滚动哈希。8.如权利要求1至7中任一项所述的计算机实现的方法,还包括当确定所述块识别哈希值匹配所述指纹时,定义所述存储对象中对应于所述数据窗口的块并且存储所述块的块边界。9.如权利要求1至7中任一项所述的计算机实现的方法,还包括:当确定所述数据窗口不是所述存储对象的所述数据结束时,确定另一数据窗口的块识别哈希值,并且确定所述另一数据窗口的所确定的块识别哈希值是否匹配所述指纹或所述存储的伪指纹。10.一种用于为了数据重复删除而处理存储对象的计算设备,包括:处理器和耦合到所述处理器的存储器;所述存储器包括具有代码的计算机可读存储介质,所述代码在被所述处理器执行时执行操作,其中所述操作包括:为所述存储对象的数据窗口确定块识别哈希值;确定所述数据窗口的所述块识别哈希值是否匹配指纹或存储的伪指纹;当确定所述数据窗口的所述块识别哈希值不匹配所述指纹或所述存储的伪指纹时,确定所述数据窗口是否是所述存储对象的数据结束;当确定所述数据窗口是所述存储对象的所述对象结束时,定义所述存储对象中对应于所述数据窗口的块的块边界并且存储所述块的块边界;及当确定所述存储对象的所述数据窗口是所述存储对象的所述数据结束时,存储所确定的块识别哈希值为所述存储对象中对应于所述数据窗口的所述块的伪指纹在所述存储器中。11.如权利要求10所述的计算设备,其中所述操作还包括:确定关于所述存储对象的所述块的块唯一性哈希并且在用于所述存储对象的所述块的重复删除索引中存储块唯一性哈希信息。12.如权利要求10所述的计算设备,其中确定所述块识别哈希值是否匹配已知的指纹...
【专利技术属性】
技术研发人员:M·亚库谢夫,M·A·史密斯,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。