【技术实现步骤摘要】
一种重复数据的删除方法及装置
本申请涉及存储
,尤其涉及一种重复数据的删除方法及装置。
技术介绍
随着技术的发展,越来越多的数据需要使用存储系统进行存储。为了节省存储系统的存储空间,提出了重复数据删除技术,即,若某个数据在存储系统中存储多份,则将该多份数据删除而只保存一份数据,从而通过缩减数据实现减少数据所占用的存储空间的目的。目前,其中一种重复数据删除技术的实现过程为:首先,计算每个数据的指纹,存储数据,记录指纹与数据的存储地址的映射。将存储的数据作为待重复数据删除的数据进行批量的重复数据删除。对存储的重复数据进行批量的重复数据删除包括:查询存储的数量在指纹表中是否有相同的指纹,如果有相同的指纹则判定该数据为重复数据,否则认为是唯一数据。并且删除前面的数据的指纹与存储地址的映射。可见,目前的重复数据删除技术是要在指纹表查找所有待重复的数据的指纹才能够判断是否是重复数据,造成重复数据删除效率低。
技术实现思路
本申请提供一种重复数据的删除方法及装置,用以提高重复数据删除技术的效率。第一方面,提供一种重复数据的删除方法,在该方法中,首先获取包含多个指纹记录项的指纹记录,其中,每个指纹记录项中包含指纹和与该指纹对应的数据的存储地址,若两个数据相同,但是存储在不同的存储地址,则会对这两个数据分别生成不同的指纹记录项,这两个指纹记录项中包括相同的指纹但是与指纹对应的存储地址不同。在获取该指纹记录后,则从该指纹记录中确定出包括同一指纹的至少两个第一指纹记录项,例如,该至少两个第一指纹记
【技术保护点】
1.一种重复数据的删除方法,其特征在于,包括:/n获取指纹记录,所述指纹记录中包含多个指纹记录项,每个指纹记录项包含指纹;/n从所述指纹记录中确定至少两个第一指纹记录项;其中,每个第一指纹记录项包含第一指纹和所述第一指纹对应的数据的存储地址;所述至少两个第一指纹记录项的所述第一指纹对应的数据的存储地址均不同;/n对所述至少两个第一指纹记录项中的所述第一指纹对应的数据进行重复数据删除操作;/n删除所述至少两个第一指纹记录项;/n在所述指纹记录中记录所述第一指纹的存根;其中,所述第一指纹的存根用于指示所述第一指纹为重复指纹。/n
【技术特征摘要】
1.一种重复数据的删除方法,其特征在于,包括:
获取指纹记录,所述指纹记录中包含多个指纹记录项,每个指纹记录项包含指纹;
从所述指纹记录中确定至少两个第一指纹记录项;其中,每个第一指纹记录项包含第一指纹和所述第一指纹对应的数据的存储地址;所述至少两个第一指纹记录项的所述第一指纹对应的数据的存储地址均不同;
对所述至少两个第一指纹记录项中的所述第一指纹对应的数据进行重复数据删除操作;
删除所述至少两个第一指纹记录项;
在所述指纹记录中记录所述第一指纹的存根;其中,所述第一指纹的存根用于指示所述第一指纹为重复指纹。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述指纹记录中记录第二指纹记录项;所述第二指纹记录项包含所述第一指纹以及所述第一指纹对应的数据的新的存储地址;其中,所述第二指纹记录项中的所述第一指纹对应的数据为新写入的数据;
根据所述第一指纹的存根确定所述第二指纹记录项中的所述第一指纹为重复指纹;
对所述新写入的数据进行重复数据删除操作。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
删除所述第二指纹记录项。
4.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:
在所述指纹记录所占用的存储空间大于或等于第一门限时,删除第三指纹记录项,所述第三指纹记录项包括的指纹与所述指纹记录中其他指纹记录项包括的指纹均不同。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
在所述指纹记录所占用的存储空间大于或等于第一门限时,删除第四指纹记录项,所述第四指纹记录项保存在所述指纹记录中的时长大于或等于第二门限。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:
在所述指纹记录所占用的存储空间大于或等于第一门限时,确定所述指纹记录在预定的时间内是否记录预定数量的第三指纹记录项;
当所述指纹记录在所述预定的时间内未记录所述预定数量的第三指纹记录项时,删除所述指纹记录中的第二指纹的存根;其中,所述第二指纹的存根用于指示所述第二指纹为重复指纹;所述第三指纹记录项包含所述第二指纹。
7.一种重复数据的删除装置,其特征在于,包括通信接口和处理器,其中:
所述通信接口,用于获取指纹记录,所述指纹记录中包含多个指纹记录项,每个指纹记录项包含指纹;
所述处理器,用于从所述指纹记录中确定至少两个第一指纹记录项;其中,每个第一指纹记录项包含第一指纹和所述第一指纹对应的数据的存储地址;所述至少两个第一指纹记录项的所述第一指纹对应的数据的存储地址均不同;以及,
对所述至少两个第一指纹记录项中的所述第一指纹对应的数据进行重复数据删除操作;以及,
删除所述至少两个第一指纹记录项;以及,
在所述指纹记录中记录所述第一指纹的存根;其中,所述第一指纹的存根用于指示所述第一指纹为重复指纹。
8.根据权利要求7所述的装置,其特征在于,所述处理器还用于:
在所述指纹记录中记录第二指纹记录项;所述第二指纹记录项包含所述第一指纹以及所述第一指纹对应的数据的新的存储地址;其中,所述第二指纹记录项中的所述第一指纹对应的数据为新写入的数据;
根据所述第一指纹的存根确定所述第二指纹记录项中的所述第一指纹为重复指纹;
对所述新写入的数据进行重复数据删除操作。
9.根据权利要求8所述的装置,其特征在于,所述处理器还用于:
删除所述第二指纹记录项。
10.根据权利要求7-9任一所述的装置,其特征在于,所述处理器还用于:
在所述指纹记...
【专利技术属性】
技术研发人员:任仁,王晨,郭平静,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。