从顺序存储介质恢复数据制造技术

技术编号:45587374 阅读:27 留言:0更新日期:2025-06-20 22:05
提供了一种用于管理多个顺序访问存储设备的顺序存储介质以用于在所述顺序存储介质上对目标数据进行重复数据删除存储的系统。处理器标识介质上的目标数据的片段的重复片段。处理器确定预测总恢复时间小于阈值的组合。该组合包括标识的重复片段、重写片段和新的数据片段中的一个或多个。重写片段是被指定用于作为新数据重写到介质上的重复片段。新的数据片段包括当前未存储在介质上的重复片段中的数据,即,非重复片段。新的数据片段被指定用于作为新数据首次被写入到介质上。处理器根据组合指示写入,即,将重写片段和/或新的数据片段写入标识的介质上。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、在本专利技术的一些实施例中,本专利技术涉及存储系统,更具体地,但不排他地,涉及对在顺序存储介质上存储数据的基于重复数据删除的存储系统的管理。

2、基于重复数据删除(deduplication/dedup)的存储系统通过存储指向先前存储的数据块的引用,而不是存储相同数据块的另一个重复数据块,消除了对相同数据块的冗余存储。但是,即使使用了重复数据删除,对存储的需求也达到了磁盘已经不能足够大以满足需求的程度。由于磁带价格较低和/或数据保留时间较长,辅助存储和归档的重点正在从具有重复数据删除功能的磁盘转移到顺序存储介质(如磁带技术)。磁带中的寻道时间相对较长,约在几十秒的量级,这是磁带驱动器将磁带滚动到读取数据所需的位置所需的时间。根据线性磁带开放(linear tape open,lto)9标准,磁带的长度(即最大寻道时间)超过1千米。由于磁带中的寻道时间相对较长,因此大多数应用使用的磁带除了内置压缩之外没有任何优化。


技术实现思路

1、本专利技术的一个目的是提供用于管理由多个顺序访问存本文档来自技高网...

【技术保护点】

1.一种用于对数据进行重复数据删除存储的设备(104),其特征在于,包括:

2.根据权利要求1所述的设备,其特征在于,所述处理器还用于写入元数据,所述元数据指示所述组合在所述介质上的位置,以用于进行读取并获得小于所述阈值的所述预测总恢复时间。

3.根据权利要求2所述的设备,其特征在于,所述处理器还用于读取所述元数据,以确定所述组合的所述片段的位置,从而进行读取以获得小于所述阈值的所述预测总恢复时间。

4.根据权利要求1所述的设备,其特征在于,所述至少一个重写片段和所述至少一个新的数据片段被顺序写入所述标识的介质的可用空间上。

5.根据上述权...

【技术特征摘要】
【国外来华专利技术】

1.一种用于对数据进行重复数据删除存储的设备(104),其特征在于,包括:

2.根据权利要求1所述的设备,其特征在于,所述处理器还用于写入元数据,所述元数据指示所述组合在所述介质上的位置,以用于进行读取并获得小于所述阈值的所述预测总恢复时间。

3.根据权利要求2所述的设备,其特征在于,所述处理器还用于读取所述元数据,以确定所述组合的所述片段的位置,从而进行读取以获得小于所述阈值的所述预测总恢复时间。

4.根据权利要求1所述的设备,其特征在于,所述至少一个重写片段和所述至少一个新的数据片段被顺序写入所述标识的介质的可用空间上。

5.根据上述权利要求中任一项所述的设备,其特征在于,所述处理器还用于:

6.根据权利要求5所述的设备,其特征在于,每个组合包括所述重复片段的不同子集,其中,从子集中排除的标识的重复片段被分类为重写片段。

7.根据上述权利要求中任一项所述的设备,其特征在于,所述处理器还用于:

8.根据上述权利要求中任一项所述的设备,其特征在于,所述阈值限定了从接收到恢复请求到从读取的片段重建所述目标数据并就绪的最大时间。

9.根据上述权利要求中任一项所述的设备,其特征在于,所述多个顺序访问存储设备包括磁带驱动器,所述多个介质包括盒式磁带(252),所述预测总恢复时间通过确定用于读取所述目标数据的所述片段的顺序以及根据对第一片段的最大寻道时间、根据用于读取的顺序的在片段之间的寻道时间、读取吞吐量、读取磁头绕带(wrap)变化和磁带库加载时间来计算。

10.根据权利要求9所述的设备,其特征在于,所述用于读取的顺序基于最近邻方法计算,所述最近邻方法考虑了在物理上彼此...

【专利技术属性】
技术研发人员:亚伊尔·托弗阿萨夫·纳塔逊阿维夫·库温特伊丹·扎克迈克尔·斯特恩伯格
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1