与快照相关联的文件的编目制造技术

技术编号:30220794 阅读:13 留言:0更新日期:2021-09-29 09:40
本公开涉及与快照相关联的文件的编目。一种备份系统,包括处理器和存储指令的机器可读存储装置。指令能够由处理器执行以:访问存储卷的第一快照的基于块的备份中所包括的多个块;基于上述基于块的备份的多个块,确定在存储卷上存储的第一文件系统,该第一文件系统是第一类型的文件系统;从多个过滤器中选择与第一类型的文件系统相关联的第一过滤器;基于所选择的第一过滤器,确定第一文件系统中的已改变文件;以及更新编目,以指示已改变文件与第一快照相关联。一快照相关联。一快照相关联。

【技术实现步骤摘要】
与快照相关联的文件的编目

技术介绍

[0001]计算设备可以包括诸如处理器、存储器、缓存系统、和存储设备之类的组件。存储设备可以包括使用磁性介质来存储和检索(retrieve)数据块的硬盘驱动器。一些系统可以存储或“备份”重要数据的副本,以用于存档和恢复目的。例如,在存储设备发生故障的情况下,可以使用备份副本来恢复存储在故障系统上的数据。在一些示例中,可以周期性地执行备份,以捕捉不同时间点的数据的副本。
附图说明
[0002]下面的附图描述了一些实施方案。
[0003]图1是根据一些实施方案的示例系统的示意图。
[0004]图2是根据一些实施方案的示例文件系统的图示。
[0005]图3是根据一些实施方案的示例备份系统的示意图。
[0006]图4是根据一些实施方案的示例过程的图示。
[0007]图5是根据一些实施方案的示例过程的图示。
[0008]图6是根据一些实施方案的存储指令的示例机器可读介质的示意图。
[0009]图7是根据一些实施方案的示例计算设备的示意图。
具体实施方式
[0010]计算系统的备份过程可以包括将存储在存储设备(例如,存储阵列)中的数据块复制到备份设备,备份设备可以以备份的形式存储数据块。在本文描述的示例中,“备份”可以指备份设备存储数据集合的形式,其可以不同于数据块被存储在从其备份的存储设备(例如,存储阵列)上的形式。例如,备份可以包括复制到备份设备以进行备份的数据块的重复消除表示。在一些示例中,备份过程可以将在文件系统的文件和目录中的存储在存储设备上的指定数据集合复制到备份设备。
[0011]在一些示例中,要复制到备份设备的指定数据集合可以包括存储设备的一个或多个卷、其中的数据被存储在存储设备上的文件系统的部分或全部内容(例如,所有数据被存储在给定目录下,例如,根目录或一个或多个子目录)等。当生成完全备份时,备份过程可以将指定数据集合的所有数据块复制到备份设备(备份设备可以将其存储为在本文中称为“完全备份”的备份)。当生成增量备份时,备份过程可以仅仅复制指定数据集合的自先前备份以来已经改变的数据块,并且备份设备可以以本文中称为“增量备份”的形式存储这些改变的块。
[0012]在一些示例中,可以基于源存储设备的一个或多个卷(或一个或多个其他数据集合)的时间点快照生成备份(例如,备份过程可以基于源存储设备上的快照的内容将数据复制到备份设备)。在一些示例中,可以基于包含指定数据集合(例如,文件系统的一个或多个指定目录)的一个或多个卷(或一个或多个其他数据集合)的时间点快照来识别指定数据集合中的已改变块(例如,用于增量备份)。
[0013]在本文描述的示例中,备份过程是指在块级(block level)复制数据以进行备份的“基于块的”备份过程。在本文描述的示例中,块级是低于文件和目录级数据存储的数据存储级。在这样的示例中,块级可以是块存储设备(例如,硬盘驱动器(HDD)、固态驱动器(SSD)等)或虚拟卷可以在其上存储数据的级别,并且是文件系统实现文件和目录的级别。在本文描述的示例中,虽然可以在文件系统级(例如,一个或多个目录等)指定要备份的数据集合,但是基于块的备份过程可以将构成数据集合的数据块作为数据块流复制到备份设备,而不需要提供单独的描述这些数据块的数据如何被存储在源设备的文件系统中的文件级或目录级信息。但是,基于块的备份可能包括嵌入的文件系统元素、元数据元素、以及块本身的内容中的其他结构元素。这些元素可以包括inode信息、卷管理元素、格式元素、以及对用户不可见但属于存储格式的一部分的其他项。与可以在文件级执行备份的文件级备份过程相比,可以考虑这样的块级备份过程,在文件级备份过程中,数据与例如指示正在备份的文件和存储这些文件的目录的文件级和目录级信息一起被作为文件流提供给备份设备。但是,与基于块的备份相比,基于文件的备份可能不包括嵌入在正在备份的内容中的文件系统元素、元数据元素、和其他结构元素。在本文描述的示例中,备份(例如,完全备份和增量备份)是指表示提供给备份设备的数据块流的块级备份,不包括描述这些数据块的数据如何被存储在源设备的文件系统中的单独的文件级或目录级信息。
[0014]此外,如本文所使用的,“快照”是一个或多个存储卷(或一个或多个其他数据集合)在特定时间点包括的数据的表示。然而,识别快照之间的新的或已改变的文件和/或目录(本文中称为“文件系统对象”)可能涉及“装载”快照中表示的数据,然后遍历或“走过”装载数据中包括的文件系统以找出一个或多个文件和一个或多个目录的改变(例如,基于感兴趣的时间戳)。然而,此类技术可能涉及大量时间和处理带宽。
[0015]如下面参考图1

7所述,一些实施方案可以包括分析基于块的备份(例如,快照)的块的内容,从块的内容识别其中的块被存储在源存储设备(即,与备份设备分离)中的文件系统,以及选择对应于所识别的文件系统的类型的特定过滤器。所选择的过滤器可以被用来识别包括文件系统的元数据的块。可以分析元数据,以确定文件系统中的对象的任何改变(例如,新文件、已改变目录等)。此类改变信息可以被用来生成和/或更新与各种快照相关联的已改变对象的编目,而无需装载每个快照然后遍历所包括的任何文件系统。通过这种方式,可以减少识别与快照相关联的文件系统对象所需要的时间量和处理带宽。
[0016]现在参考图1,示出了根据一些实施方案的示例系统100的示意图。如图所示,系统100可以包括备份设备110和存储设备120。备份设备110可以是备份装备(例如,包括一个或多个控制器和一个或多个存储设备)或任何其他类型的计算设备(例如,存储阵列、服务器等)。存储设备120可以包括一个或多个存储设备,例如,非易失性存储设备(例如,HDD、SSD等)。在一些示例中,存储设备120可以是存储阵列。
[0017]如图所示,在一些实施方案中,备份设备110可以包括处理资源112和机器可读存储装置114。处理资源112可以包括处理器、中央处理单元(CPU)、处理内核等中的一个或多个。处理资源112可以包括任意数目的处理引擎或“内核”(未示出)。机器可读存储装置114可以包括一个或多个非暂态存储介质,例如,HDD、SSD、闪存、光盘等。
[0018]在一些实施方案中,机器可读存储装置114可以包括备份模块115、编目模块117、和备份存储区119。下面参考图3

7讨论编目模块117和备份存储区119。在一些示例中,备份
模块115和/或编目模块117可以通过可由处理资源112执行并存储在机器可读存储装置114中的指令(例如,软件和/或固件)来实现。然而,备份模块115和/或编目模块117可以以任何合适的方式实现。例如,备份模块115和/或编目模块117的部分或全部可以被硬编码为包括在处理资源112中的电路。在其他示例中,备份模块115和/或编目模块117的部分或全部可以被实现为远程计算机(未示出)上的网络(web)服务等。在另一示例中,备份模块115和/或编本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算设备,包括:处理器,所述处理器包括多个处理引擎;以及存储指令的机器可读存储装置,所述指令能够由所述处理器执行以:访问存储卷的第一快照的基于块的备份中的多个块;基于所述基于块的备份中的所述多个块,确定存储在所述存储卷上的第一文件系统,所述第一文件系统是第一类型的文件系统;从多个过滤器中选择与所述第一类型的文件系统相关联的第一过滤器;基于所选择的第一过滤器,确定所述第一文件系统中的已改变文件;以及更新编目以指示所述已改变文件与所述第一快照相关联。2.如权利要求1所述的计算设备,所述指令能够由所述处理器执行以:确定识别所述存储卷中的所述第一文件系统的第一块;以及基于所述第一块确定所述第一类型的文件系统。3.如权利要求1所述的计算设备,所述指令能够由所述处理器执行以:访问来自由备份设备从包括所述存储卷的存储系统接收的第一数据流的所述基于块的备份的所述多个块。4.如权利要求1所述的计算设备,所述指令能够由所述处理器执行以:在所述基于块的备份被存储在所述备份设备的备份存储区中之后,访问所述基于块的备份的所述多个块。5.如权利要求1所述的计算设备,所述指令能够由所述处理器执行以:使用所选择的第一过滤器,识别所述第一快照中包括所述第一文件系统的元数据的一组块;以及基于包括所述第一文件系统的元数据的所述一组块,确定所述第一文件系统中的所述已改变文件。6.如权利要求4所述的计算设备,所述指令能够由所述处理器执行以:分析所述一组块中的元数据,以确定所述第一文件系统的一组对象的名称和位置;在分析所述元数据期间,在数据结构中跟踪所述一组对象;基于所跟踪的一组对象,确定树结构;识别所述树结构和先前树结构之间的差异;以及基于所识别的差异,确定所述第一文件系统中的所述已改变文件。7.如权利要求1所述的计算设备,所述指令能够由所述处理器执行以:基于所述多个块,确定存储在所述存储卷上的第二文件系统,所述第二文件系统是第二类型的文件系统;从多个过滤器中选择与所述第二类型的文件系统相关联的第二过滤器;以及基于所选择的第二过滤器,确定所述第二文件系统中的已改变对象。8.一种非暂态机器可读存储介质,存储在执行时使得处理器执行以下操作的指令:由备份系统访问存储卷的第一快照的基于块的备份中所包括的多个块;基于所述基于块的备份的所述多个块,确定存储在所述存储卷上的第一文件系统,所述第一文件系统是第一类型的文件系统;从多个过滤器中选择与所述第一类型的文件系统相关联的第一过滤器;
基于所选择的第一过滤器,确定所述第一文件系统中的已改变文件;以及更新编目以指示所述已改变文件与所述第一快照相关联。9.如权利要求8所述的非暂态机器可读存储介质,包括使得所述处理器执行以下操作的指令:确定识别所述存储卷中的所述第一文件系统的第一块;以及基于所述第一块,确定所述第一类型的文件系统。10.如权利要求8所述的非暂态机器可读存储介质,包括使得所述处理器执行以下操作的指令:访问来自由备份设备从包括所述存储卷的存储系统接收的...

【专利技术属性】
技术研发人员:A
申请(专利权)人:慧与发展有限责任合伙企业
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1