本发明专利技术公开了一种数据备份方法及装置,涉及数据备份技术领域。该方法包括:分析待备份数据块的指纹;以所述指纹为关键字在缓存池中查找相同的指纹;若存在相同的指纹,则将所述指纹对应的索引信息中虚拟卷页的引用计数加一;若不存在相同的指纹,则将所述待备份数据块存储到虚拟卷上,将所述待备份数据块的元数据信息存储在所述缓存池中,并在索引表中为所述待备份数据块创建索引信息,将所创建的索引信息中所述待备份数据块对应的虚拟卷页的引用计数设为一;以及周期性查询所述索引表,删除引用计数低于预设阈值的虚拟卷页对应的元数据信息。本发明专利技术实施例提供的方法及装置,能够在不影响系统性能的前提下实现重删性能的提高。
【技术实现步骤摘要】
本专利技术涉及数据备份
,尤其涉及一种数据备份方法及装置。
技术介绍
随着备份数据的日益增多,重复数据删除(DataDe-duplication)被越来越广泛的应用,以降低数据存储的成本。重复数据删除也称重删,如字义所言就是不存储重复的部分以减少空间耗用,找出相同的数据,相同数据的只存储一份,以索引来记录,还原时根据索引就能回溯计算出原来文件的组成型式。重删过程通常是这样的首先,将数据文件分割成一组数据块,采用哈希(Hash)算法为每个数据块计算指纹((Fingerprint,FP),具有相同指纹的数据块即可认为是相同的数据块,存储系统中仅需要保留一份);在进行数据的备份存储时,对每个待备份数据块,以指纹为关键字在索引中进行哈希查找,匹配则表示该数据块为重复数据块,仅存储该数据块的索引信息,不匹配则表示该数据块是一个新的唯一块,对该数据块进行存储并创建相关元数据信息,元数据信息包括数据块的指纹。现有的数据的备份存储中,通常使用将重删后的数据的元数据缓存到内存中,将重删后的数据存储到底层磁盘上的方式,完成待备份数据的备份。在进行每个数据块的备份时,先到内存中查找元数据以完成重删,这样缩短了将元数据存储到底层磁盘对元数据时进行元数据访问的时间,一定程度上提高了访问性能,从而提高了重删性能。但是由于备份数据量一般很大,对应的元数据也很大,因此需要消耗掉大量的内存,影响系统性能。采用较大的内存固然可以在提高重删性能的前提下提高系统性能,但是由于内存颗粒的价格较高,所以受到了一定的限制。
技术实现思路
有鉴于此,本专利技术提供了一种数据备份方法及装置,能够在不影响系统性能的前提下实现重删性能的提高。为了实现上述目的,在第一方面,本专利技术实施例提供了 一种数据备份方法,包括分析待备份数据块的指纹;以所述指纹为关键字在缓存池中查找相同的指纹;若存在相同的指纹,则将所述指纹对应的索引信息中虚拟卷页的引用计数加一;若不存在相同的指纹,则将所述待备份数据块存储到虚拟卷上,将所述待备份数据块的元数据信息存储在所述缓存池中,并在索引表中为所述待备份数据块创建索引信息,将所创建的索引信息中所述待备份数据块对应的虚拟卷页的引用计数设为一;以及周期性查询所述索引表,删除所述缓存池中引用计数低于预设阈值的虚拟卷页对应的元数据信息,所述预设阈值是自然数。其中,所述缓存池中存储有已存储的各数据块的元数据信息;所述索引表包括已存储的各数据块对应的虚拟卷页的索引信息,所述索引信息包括数据块对应的虚拟卷页的地址、以及数据块的元数据信息在所述缓存池中的存储地址,所述元数据信息包括所述数据块的指纹;所述引用计数用于记录所述虚拟卷页所对应的数据块被引用的次数。结合第一方面,在第二种可能的实现方式中,所述若不存在相同的指纹,则将所述待备份数据块存储到虚拟卷上,将所述待备份数据块的元数据信息存储在所述缓存池,并在索引表中为所述待备份数据块创建索引信息,将所创建的索引信息中所述待备份数据块对应的虚拟卷页的引用计数设为一的步骤具体包括为所述待备份数据块分配虚拟卷页以及缓存池中的存储空间;在所述索引表中创建所述待备份数据块的索引信息,并将所分配的虚拟卷页的引用计数记为一;以及将所述待备份数据块存储到所述虚拟卷页对应的磁盘空间中,将其元数据信息存储到所分配的缓存池中的存储空间中。结合第一方面的或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述索弓I信息中还包括访问时间,用于记录最近一次更新所述索弓I信息的时间。结合第一方面的第二种可能的实施方式,在第三种可能的实现方式中,所述方法还包括周期性查询所述索引表,获得访问时间最近的第一预设数量的索引信息;在所述第一预设数量的索引信息中,按照虚拟卷页的引用计数从小到大的顺序,删除所述缓存池中引用计数最小的第二预设数量的虚拟卷页对应的元数据信息。结合第一方面或第一方面的上述实现方式中的任一种,在第四种可能的实现方式中,所述缓存池设置在固态硬盘SSD中。在第二方面,本专利技术实施例提供了一种数据备份装置,包括分析单元,用于分析待备份数据块的指纹;匹配单元,用于以所述分析单元所分析出的指纹为关键字在缓存池中查找匹配的指纹;备份单元,用于根据所述匹配单元的查找结果进行待备份数据块的备份若存在相同的指纹,则将所述指纹对应的索引信息中虚拟卷页的引用计数加一;若不存在相同的指纹,则将所述待备份数据块存储到虚拟卷上,将所述待备份数据块的元数据信息存储在所述缓存池中,并在索引表中为所述待备份数据块创建索引信息,将所创建的索引信息中所述待备份数据块对应的虚拟卷页的引用计数设为一;以及淘汰单元,用于周期性查询所述索引表,删除所述缓存池中引用计数低于预设阈值的虚拟卷页对应的元数据信息,所述预设阈值是自然数;其中,所述缓存池中存储有已存储的各数据块的元数据信息;所述索引表包括已存储的各数据块对应的虚拟卷页的索引信息,所述索引信息包括数据块对应的虚拟卷页的地址、以及数据块的元数据信息在所述缓存池中的存储地址,所述元数据信息包括所述数据块的指纹;所述引用计数用于记录所述虚拟卷页所对应的数据块被引用的次数。结合第二方面,在第一种可能的实现方式中,所述索引信息中还包括访问时间,用于记录最近一次更新所述索引信息的时间;所述淘汰单元还用于周期性查询所述索引表,获得访问时间最近的第一预设数量的索引信息,并在所述第一预设数量的索引信息中,按照虚拟卷页的引用计数从小到大的顺序,删除所述缓存池中引用计数最小的第二预设数量的虚拟卷页对应的元数据信息。结合第二方面或第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述缓存池设置在固态硬盘SSD中。本专利技术实施例提供的方法及装置,采用了定期淘汰的机制,对缓存池中访问频率较低的元数据进行淘汰,即从缓存池中删除相关的信息,以保证容量有限的缓存池够用,能够在不影响系统性能的前提下实现重删性能的提高,进而提高了数据备份效率。根据下面参考附图对示例性实施例的详细说明,本专利技术的其它特征及方面将变得清楚。附图说明包含在说明书中并且构成说明书的一部分的说明书附图与说明书一起示出了本专利技术的示例性实施例、特征和方面,并且用于解释本专利技术的原理。图1为本专利技术实施例的数据备份方法的流程图;图2为本专利技术实施例的数据备份方法中的索引表示意图;图3为本专利技术实施例的数据备份方法的部分流程图;图4为本专利技术实施例的一种数据备份装置的结构框图;图5为本专利技术实施例的另一种数据备份装置的结构框图。具体实施例方式以下将参考附图详细说明本专利技术的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。另外,为了更好的说明本专利技术,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有这些具体细节,本专利技术同样可以实施。在另外一些实例中,对于大家熟知的方法、手段、元件和电路未作详细描述,以便于凸显本专利技术的主旨。现代存储技术中,磁盘根据自身的管理方式,将实际存储空间划分为固定大小的磁盘块进行管理,然后将各个磁盘块按一定本文档来自技高网...
【技术保护点】
一种数据备份方法,其特征在于,包括:分析待备份数据块的指纹;以所述指纹为关键字在缓存池中查找相同的指纹;若存在相同的指纹,则将所述指纹对应的索引信息中虚拟卷页的引用计数加一;若不存在相同的指纹,则将所述待备份数据块存储到虚拟卷上,将所述待备份数据块的元数据信息存储在所述缓存池中,并在索引表中为所述待备份数据块创建索引信息,将所创建的索引信息中所述待备份数据块对应的虚拟卷页的引用计数设为一;以及周期性查询所述索引表,删除所述缓存池中引用计数低于预设阈值的虚拟卷页对应的元数据信息,所述预设阈值是自然数;其中,所述缓存池中存储有已存储的各数据块的元数据信息;所述索引表包括已存储的各数据块对应的虚拟卷页的索引信息,所述索引信息包括数据块对应的虚拟卷页的地址、以及数据块的元数据信息在所述缓存池中的存储地址,所述元数据信息包括所述数据块的指纹;所述引用计数用于记录所述虚拟卷页所对应的数据块被引用的次数。
【技术特征摘要】
1.一种数据备份方法,其特征在于,包括 分析待备份数据块的指纹; 以所述指纹为关键字在缓存池中查找相同的指纹; 若存在相同的指纹,则将所述指纹对应的索引信息中虚拟卷页的引用计数加一;若不存在相同的指纹,则将所述待备份数据块存储到虚拟卷上,将所述待备份数据块的元数据信息存储在所述缓存池中,并在索引表中为所述待备份数据块创建索引信息,将所创建的索引信息中所述待备份数据块对应的虚拟卷页的引用计数设为一;以及 周期性查询所述索引表,删除所述缓存池中引用计数低于预设阈值的虚拟卷页对应的元数据信息,所述预设阈值是自然数; 其中,所述缓存池中存储有已存储的各数据块的元数据信息;所述索引表包括已存储的各数据块对应的虚拟卷页的索引信息,所述索引信息包括数据块对应的虚拟卷页的地址、以及数据块的元数据信息在所述缓存池中的存储地址,所述元数据信息包括所述数据块的指纹;所述引用计数用于记录所述虚拟卷页所对应的数据块被引用的次数。2.根据权利要求1所述的方法,其特征在于,所述若不存在相同的指纹,则将所述待备份数据块存储到虚拟卷上,将所述待备份数据块的元数据信息存储在所述缓存池,并在索引表中为所述待备份数据块创建索引信息,将所创建的索引信息中所述待备份数据块对应的虚拟卷页的引用计数设为一的步骤具体包括 为所述待备份数据块分配虚拟卷页以及缓存池中的存储空间; 在所述索引表中创建所述待备份数据块的索引信息,并将所分配的虚拟卷页的引用计数记为一;以及 将所述待备份数据块存储到所述虚拟卷页对应的磁盘空间中,将其元数据信息存储到所分配的缓存池中的存储空间中。3.根据权利要求1或2所述的方法,其特征在于,所述索引信息中还包括访问时间,用于记录最近一次更新所述索引信息的时间。4.根据权利要求3所述的方法,其特征在于,所述方法还包括 周期性查询所述索引表,获得访问时间最近的第一预设数量的索引信息...
【专利技术属性】
技术研发人员:夏勇,张宗全,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。