【技术实现步骤摘要】
基于存储设备的磨损量的重复数据删除系统阈值
技术介绍
诸如主机服务器等的客户端计算设备可以将数据存储在主存储阵列中,并且可以针对存储在主存储阵列中的数据执行工作负荷。在一些示例中,出于诸如冗余和数据保护等目的,可以将存储在主存储阵列中的数据备份在与客户端计算设备和主存储阵列两者分开的备份装置中。在一些示例中,例如,备份装置可以以重复数据删除(deduplicated)的形式存储数据,使得与在主存储阵列上相比更紧凑地存储数据。附图说明以下具体实施方式参考附图,其中:图1是用于基于存储设备磨损量来调整阈值的示例重复数据删除系统的框图;图2是包括调整容器索引阈值的示例方法的流程图;图3是包括调整压缩阈值的示例方法的流程图;图4是具有可调压缩阈值的示例重复数据删除系统的框图;图5是包括设置容器索引阈值的示例方法的流程图;图6是包括设置压缩阈值的示例方法的流程图;图7是用于获得存储设备磨损量的指示的示例重复数据删除系统的框图;以及图8是包括调整压缩阈值的示例方法的流程图。具体实施方式如上所述,计算设备(诸如主机、服务器、存储阵列等)可以通过将数据存储在能够对数据执行重复数据删除的计算系统中(此处称为“重复数据删除系统”)来备份数据,以便以比非重复数据删除的形式更紧凑的重复数据删除的形式存储数据。在本文所描述的示例中,重复数据删除过程可以由重复数据删除系统对数据集合(在本文中称为数据的“流”或“数据流”)执行。图1是根据本文描述的示例的基于 ...
【技术保护点】
1.一种方法,包括:/n获得存储有重复数据删除系统的多个容器索引的至少一个存储设备所经历的磨损量的指示;/n基于所述磨损量调整容器索引阈值;/n在所述多个容器索引中识别具有针对给定数据流的给定部分的命中的容器索引;/n从所述至少一个存储设备中取回一数量的所识别容器索引,所述数量不超过所述容器索引阈值,其中,所述容器索引阈值是要从所述至少一个存储设备读取以对任何数据流的单个部分进行重复数据删除的所识别容器索引的最大数量;以及/n相对于所取回的容器索引对所述给定部分执行重复数据删除。/n
【技术特征摘要】
20200127 US 16/773,7101.一种方法,包括:
获得存储有重复数据删除系统的多个容器索引的至少一个存储设备所经历的磨损量的指示;
基于所述磨损量调整容器索引阈值;
在所述多个容器索引中识别具有针对给定数据流的给定部分的命中的容器索引;
从所述至少一个存储设备中取回一数量的所识别容器索引,所述数量不超过所述容器索引阈值,其中,所述容器索引阈值是要从所述至少一个存储设备读取以对任何数据流的单个部分进行重复数据删除的所识别容器索引的最大数量;以及
相对于所取回的容器索引对所述给定部分执行重复数据删除。
2.如权利要求1所述的方法,还包括:
基于确定所述至少一个存储设备所经历的磨损量已经超过阈值磨损量来增大所述容器索引阈值。
3.如权利要求1所述的方法,其中,基于所述磨损量调整所述容器索引阈值包括:
随着所述至少一个存储设备的磨损量增加,递增所述容器索引阈值。
4.如权利要求3所述的方法,还包括:
每当确定所述磨损量已经超过多个相继更大磨损水平边界的下一个边界时,增大所述容器索引阈值。
5.如权利要求1所述的方法,其中,所述磨损量由对所述至少一个存储设备的剩余寿命量的估计来表示。
6.如权利要求1所述的方法,其中:
所述重复数据删除系统包括多个容器,每个容器包括一个或多个数据块;
所述容器索引中的每个容器索引是多个容器中的相应容器的索引;
所述容器索引中的每个容器索引包括一个或多个条目,每个条目针对相应容器的相应块,所述容器索引是该相应容器的索引,并且针对相应块的每个条目包括:
所述相应块的块签名;以及
所述块签名的引用计数。
7.如权利要求6所述的方法,其中,所述识别具有针对所述给定部分的命中的容器索引包括:
将所述给定数据流的所述给定部分的经选择的块签名与稀疏索引进行比较,所述稀疏索引将块签名映射到所述多个容器索引中的容器索引;以及
基于存在于所述稀疏索引中的所述经选择的块签名,在所述多个容器索引中识别具有针对所述给定部分的命中的容器索引。
8.如权利要求7所述的方法,其中:
所述稀疏索引将所述稀疏索引中的每个块签名映射到所述多个容器索引中的具有包括所述块签名的条目的容器索引的标识符;并且
其中,所述识别具有针对所述给定部分的命中的容器索引包括:将所述容器索引中的、具有在所述稀疏索引中将所述经选择的块签名中的给定块签名映射到的标识符的每个容器索引识别为具有命中的容器索引。
9.如权利要求6所述的方法,还包括:
基于所述磨损量调整压缩阈值;
对所述容器索引中的具有大于或等于所述压缩阈值的数量的未被引用的条目的经选择的容器索引执行压缩;以及
防止对任何具有小于所述压缩阈值的数量的未被引用的条目的容器索引进行压缩;
其中,针对所述容器索引中的每个容器索引的所述条目中的每个条目,该条目的引用计数指示该条目是否未被引用。
10.如权利要求8所述的方法,其中,基于所述磨损量调整所述压缩阈值包括:
随着所述至少一个存储设备的磨损量增加,递增所述压缩阈值。
11.如权利要求6所述的方法,还包括:
响应于确定所述至少一个存储设备所经历的磨损量已超过锁定阈值:
针对每个容器索引的每个条目,当所述引用计数达到计数阈值时,将该引用计数指定为不可修改的,使得其在被指定为不可修改时不会被改变。
12.如权利要求11所述的方法,其中,所述多个容器索引包括容器索引的子集,在所述容器索引的子集中的每个条目的引用计数被指定为不可修改的,使得其在被指定为不可修改时不会被改变。
13.一种重复数据删除系统,包括:
至少一个处理资源;以及
至少一个非暂态机器可读存储介质,所述至少一个非暂态机器可读存储介质包括指令,所述指令可由至少一个处理资源执行以进行以下操作:
获得存储有所述重复数据删除系统的多个容器索引的至少一个存储设备所经历的磨损量的指示,所述...
【专利技术属性】
技术研发人员:J·巴特,D·多纳希,M·贾恩,
申请(专利权)人:慧与发展有限责任合伙企业,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。