预置重复数据删除数据存储区制造技术

技术编号:39638608 阅读:11 留言:0更新日期:2023-12-09 11:00
提供了一种预置重复数据删除数据存储区的系统

【技术实现步骤摘要】
预置重复数据删除数据存储区

技术介绍

[0001]可以应用数据归约技术来减少存储在存储系统中的数据量

示例数据归约技术包括重复数据删除
(deduplication)。
重复数据删除标识重复的数据单元,并且力图缩减或消除存储在存储系统中的重复数据单元的实例的数量

附图说明
[0002]关于以下附图描述了一些实施方式

[0003]图1是根据一些实施方式的示例系统的示意图

[0004]图2是根据一些实施方式的示例资源分配的图示

[0005]图3是根据一些实施方式的示例数据结构的图示

[0006]图4是根据一些实施方式的示例输入参数的图示

[0007]图5是根据一些实施方式的示例常数值的图示

[0008]图6是根据一些实施方式的示例过程的图示

[0009]图7是根据一些实施方式的示例计算设备的示意图

[0010]图8是根据一些实施方式的示例过程的图示

[0011]图9是根据一些实施方式的存储有指令的示例机器可读介质的图

[0012]在所有附图中,相同的附图标记指代相似但不一定相同的要素

附图不一定是按比例绘制的,并且一些部分的尺寸可以被放大以更清楚地图示所示的示例

此外,附图提供了与描述一致的示例和
/
或实施方式;然而,描述不限于附图中提供的示例和
/
或实施方式

具体实施方式
[0013]在本公开中,除非上下文另外明确指示,否则使用术语“一个
(a)”、“一种
(an)”或“所述
(the)”旨在同样包括复数形式

同样地,当在本公开中使用时,术语“包括
(includes/including/comprises/comprising)”或“具有
(have/having)”指明存在所述元件,但不排除存在或添加其他元件

[0014]在一些示例中,存储系统可以对数据进行重复数据删除以减少存储数据所需的空间量

存储系统可以执行重复数据删除过程,包括将数据流分解为离散的数据单元或“组块
(chunk)”。
进一步地,存储系统可以确定传入数据单元的标识符或“指纹
(fingerprint)”,并且可以确定哪些传入数据单元是先前存储的数据单元的复制品

在数据单元是复制品的情况下,存储系统可以存储对先前数据单元的引用,而不是存储重复的传入数据单元

[0015]如本文所使用的,“指纹”是指通过对数据单元的内容应用函数而得到的值
(
其中“内容”可以包括数据单元的内容的全部或子集
)。
可以应用的函数的示例包括基于传入数据单元产生散列值的散列函数

散列函数的示例包括如安全散列算法
2(SHA

2)
散列函数
(
例如,
SHA

224、SHA

256、SHA

384

)
等密码散列函数

在其他示例中,可以采用其他类型的散列函数或其他类型的指纹函数

[0016]“存储系统”可以包括一个存储设备或多个存储设备

存储系统还可以包括管理对
如存储阵列等
(
多个
)
存储设备的访问的
(
多个
)
存储控制器
。“数据单元”可以指可以在存储系统中单独标识的任何数据部分

在一些情况下,数据单元可以指组块

组块的集合

或任何其他数据部分

在一些示例中,存储系统可以将数据单元存储在持久性存储装置中

可以使用一种或多种
(
多个
)
持久性
(
例如,非易失性
)
存储设备
(

(
多个
)
基于磁盘的存储设备
(
例如,
(
多个
)
硬盘驱动器
(HDD))、(
多个
)
固态设备
(SSD)(

(
多个
)
闪速存储设备
)
等或者其组合
)
来实施持久性存储装置

[0017]“控制器”可以指硬件处理电路,其可以包括微处理器

多核微处理器的核

微控制器

可编程集成电路

可编程门阵列

数字信号处理器或其他硬件处理电路中的任一项或某种组合

可替代地,“控制器”可以指硬件处理电路与可在硬件处理电路上执行的机器可读指令
(
软件和
/
或固件
)
的组合

[0018]在一些示例中,重复数据删除任务可以由在本文称为“重复数据删除数据存储区”的单独存储系统来执行

每个重复数据删除数据存储区可以实施为提供物理存储系统的抽象化并且包括表示物理存储系统的硬件部件的虚拟化部件的虚拟化系统或设备

在一些示例中,单个物理存储系统可以托管彼此独立操作的多个虚拟重复数据删除数据存储区

例如,第一虚拟重复数据删除数据存储区可以保护
(
即,处理和存储
)
商业网站的备份数据,并且第二虚拟重复数据删除数据存储区可以保护公司会计系统的备份数据

[0019]在一些示例中,主机系统的计算资源可以在一个或多个重复数据删除数据存储区之间进行分配

例如,可以向每个重复数据删除数据存储区指派主机处理器

主机存储器

本地主机存储装置等的特定部分

然而,如果没有为某个重复数据删除数据存储区分配足够的计算资源,那么这个重复数据删除数据存储区可能不能高效地处理备份数据

在这样的情况下,备份过程可能会相对较慢地执行,并且可能无法在下一个备份过程被调度运行之前完成

进一步地,如果为重复数据删除数据存储区分配过量的计算资源,那么那些资源可能会被浪费

因此,分配过量的资源可能会导致相对较高的成本,但是却不提供任何附加益处

[0020]根据本公开的一些实施方式,存储管本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种系统,包括:处理器;存储器;以及存储有指令的机器可读存储装置,所述指令能够由所述处理器执行以进行以下操作:接收输入,所述输入指示重复数据删除数据存储区的预期数据量和至少一个保留期;执行所述至少一个保留期与存储的数据结构的比较;基于所述至少一个保留期与所述存储的数据结构的比较,确定至少一个存储乘数;以及基于所述预期数据量和所述至少一个存储乘数,确定要为所述重复数据删除数据存储区预置的存储量
。2.
如权利要求1所述的系统,包括能够由所述处理器执行以进行以下操作的指令:至少基于所确定的存储量来预置所述重复数据删除数据存储区
。3.
如权利要求1所述的系统,其中,所述存储的数据结构包括多个行,并且其中,每一行包括最大保留期和存储乘数的不同组合
。4.
如权利要求3所述的系统,其中,所述存储的数据结构是基于有关最常用于特定最大保留期的第一保留方案的专家知识而用所述存储乘数填充的
。5.
如权利要求4所述的系统,其中,所述存储的数据结构是进一步基于有关与所述第一保留方案的不同部分相关联的存储要求的经验信息而用所述存储乘数填充的
。6.
如权利要求1所述的系统,包括能够由所述处理器执行以进行以下操作的指令:基于最大本地保留与所述存储的数据结构的比较确定本地存储乘数;以及基于所述本地存储乘数和所述每日数据量确定本地存储量
。7.
如权利要求6所述的系统,包括能够由所述处理器执行以进行以下操作的指令:基于最大远程保留与所述存储的数据结构的比较确定远程存储乘数;基于所述远程存储乘数和所述每日数据量确定远程存储量;基于所述远程存储量和远程元数据大小确定远程元数据量;以及基于所述本地存储量和所述远程元数据量确定要预置的本地存储的总量
。8.
如权利要求1所述的系统,包括能够由所述处理器执行以进行以下操作的指令:确定所述重复数据删除数据存储区的数据会话的数量;确定要为所述重复数据删除数据存储区预置的总内存量;确定要为所述重复数据删除数据存储区预置的处理器数量;以及确定要为所述重复数据删除数据存储区预置的每秒输入
/
输出操作
(IOPS)
数量
。9.
一种方法,所述方法包括:通过存储管理系统接收输入,所述输入指示重复数据删除数据存储区的预期数据量和至少一个保留期;通过所述存储管理系统执行所述至少一个保留期与存储的数据结构的比较;通过所述存储管理系统基于所述至少一个保留期与所述存储的数据结构的比较,确定至少一个存储乘数;以及通过所述存储管理系统基于所述预期数据量和所述至少一个存储乘数,确定要为所述重复数据删除数据存储区预置的存储量

10.
如权利要求9所述的方法,进一步包括:至少基于所确定的存储量来预置所述重复数据删除数据存储区
。11.
如权利要求9所述的方法,其中,所述存储的数据结构包括多个行,并且其中,每一行包括最大保留期和存储乘数的不同组合
。12.
如权利要求<...

【专利技术属性】
技术研发人员:P
申请(专利权)人:慧与发展有限责任合伙企业
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1