用于备份文件系统的方法和设备技术方案

技术编号:38644323 阅读:25 留言:0更新日期:2023-08-31 18:35
本公开涉及一种用于备份文件系统的计算机实现的方法和装置。该方法包括:处理器接收提供提前备份时间窗口的用户输入,该提前备份窗口在该文件系统的计划每日备份时间之前;该处理器识别该文件系统中适用于提前备份的一个或多个文件;该处理器在该提前备份时间窗口内为该一个或多个确定的文件启动提前备份;该处理器在该计划每日备份时间为该文件系统中的多个剩余文件启动计划每日备份。的多个剩余文件启动计划每日备份。的多个剩余文件启动计划每日备份。

【技术实现步骤摘要】
【国外来华专利技术】用于备份文件系统的方法和设备


[0001]本公开大体上涉及数据保护和备份领域;更具体地,涉及用于备份文件系统的方法和装置。

技术介绍

[0002]在这个数据驱动的世界中,大量的数据正在全球范围内定期生成和存储。例如,社交网络、物联网、科学实验、商业服务、工业服务、银行服务、商业互动等在生成所述数据方面发挥着至关重要的作用。在这种情况下,数据备份对于确保数据保护变得非常重要,因为数据很容易因系统故障、电源危机、网络攻击、自然灾害、通信故障等破坏性事件而丢失或损坏。目前,各种数据保护技术被用于数据备份。
[0003]然而,现有的数据保护技术存在一些局限性。首先,现有的数据保护技术通常不允许用户定义备份,例如在活动较少期间。其次,现有的数据保护技术仅为与任意数据(如文件)关联的数据备份提供有限数量的时间点。例如,在基于快照的数据保护技术中,由于快照(即备份数据映像)是临时生成的(即最终需要删除),因此会占用相当大的空间,因为它们是以周期性的方式,即在一定的时间间隔内生成的。这将导致创建与文件关联的数据备份可用的时间点数量有限。此外,生成所述快照是昂贵的,并且它们的生成和删除需要用到大量的计算资源。当两个连续快照之间的差异很大时,例如15分钟到几个小时,基于快照的数据保护技术需要超长的备份时间。这也导致了一个相当大的恢复点目标。在基于快照的数据保护技术中,当快照被装载到阵列上供备份服务器读取时,快照会减少阵列为生产工作负载提供的带宽。此外,现有的数据保护技术需要相当大的带宽,对带宽波动敏感,在使用高级算法进行数据缩减(如压缩和广域网(wide

area network,WAN)重复数据删除)方面面临困难,容易出现显著的延迟等等。第三,现有的数据保护技术需要大量的计算资源和时间来解析文件系统,以了解数据备份所需的文件系统的文件变更,从而导致备份窗口。
[0004]通常,现有的数据利用技术用于优化备份窗口内要备份的数据量,例如,通过对数据执行主机端重复数据删除,以降低网络利用率和带宽。此外,对于数据块,一些数据利用技术旨在计划备份窗口之前备份“冷”块(如冷存储块)。但是,在块级执行此操作时,所述方案无法利用文件级存在的属性来确定应在任何时间点备份哪些数据变更。此外,现有的数据利用技术还包括数据复制技术。数据复制即通过连续或基于快照的技术将数据复制辅助位置。具体地,连续复制将每个输入输出(input

output,I/O)镜像到维护数据最新状态的远程服务器(如备份服务器),但网络带宽成本更高。
[0005]因此,根据上述讨论,需要克服上述与现有数据保护或备份技术相关的缺点。

技术实现思路

[0006]本公开寻求提供一种用于备份文件系统的改进方法、装置和系统。本公开寻求提供一种方案,解决可用于数据备份的时间点数量有限、数据备份需要大量的计算资源以及对文件系统级数据保护的限制等现有问题。本公开的目的是提供一种方案,至少部分克服
了现有技术中遇到的问题,并通过使用连续目录提供用于连续数据保护的改进方法和系统,其能够以最小的计算资源和块级数据保护提供所需时间点数量的数据备份。
[0007]本公开的目的是通过所附独立权利要求中提供的方案实现的。本公开的有利实现方式在从属权利要求中进一步定义。
[0008]在一方面,本公开提供了一种用于备份文件系统的计算机实现的方法。该方法包括:处理器接收提供提前备份时间窗口的用户输入,该提前备份窗口在该文件系统的计划每日备份时间之前;该处理器识别该文件系统中适用于提前备份的一个或多个文件;该处理器在该提前备份时间窗口内为该一个或多个确定的文件启动提前备份;该处理器在该计划每日备份时间为该文件系统中的多个剩余文件启动计划每日备份。
[0009]该方法使用户能够通过提供与用户定义的备份窗口相关的输入,对数据(如文件)执行数据备份(即恢复或还原)到任何所需的时间点,从而最大限度地减少在使用量较高时实施备份的次数。这使得用户能够在多个实例上备份数据,例如在一天结束时和首选时间窗口。处理器可以连续记录对文件系统中的文件进行的元数据操作的日志,例如以连续目录的形式。在这种情况下,处理器维护关于任何文件在特定时间点的状态的最新信息,即任何文件何时进行任何操作或变更。通常,处理器通过在连续目录中搜索文件(该文件具有状态)在某一时间点的状态,即可将文件恢复到该时间点。在这方面,该方法有助于实现接近零的恢复点目标。通过这种方式,该方法能够在因任何破坏性事件而丢失数据的情况下保障数据安全。该方法在解析文件系统以了解数据备份所需的文件系统文件的变更时,能够使用最少的计算资源和时间。该方法非常适合文件系统级数据保护和块级数据保护。该方法可以用传统的计算系统适当地实现,而无需改变计算系统的架构。
[0010]在一种实现方式中,识别包括分析文件元数据以识别自先前的计划每日备份时间以来已编辑的一个或多个文件。
[0011]通过分析文件元数据以识别一个或多个已编辑的文件,即遭受或暴露于任何操作的文件以及对此类文件进行的操作,可精确地识别和维护文件备份所需的必要信息。这有助于根据文件元数据执行备份,从而减轻计算负担。
[0012]在另一种实现方式中,该方法还包括响应于文件编辑事件,该处理器从安装在该文件系统上的代理接收该文件元数据。
[0013]该方法支持通过安装在文件系统上的代理跟踪的文件编辑事件来备份文件系统中的文件,并支持以更细粒度进行连续保护,但需要处理文件中的不一致之处,并丢弃此类不一致的文件。
[0014]在又一种实现方式中,该方法还包括:该处理器以预定时间间隔向该文件系统发送查询,并接收该文件元数据作为响应。
[0015]该方法能够通过发送或使用查询来促进数据备份,以确保实现高效和无查询的操作。
[0016]在一种实现方式中,包括识别的方法包括根据文件原生元数据确定每个文件的适用性,其中,该文件原生元数据包括文件名、文件大小、文件用户权限、文件组权限、创建时间、最后访问时间、最后修改时间和文件类型中的一个或多个。
[0017]在操作中,该方法能够在确定具有状态的每个文件的适用性时将文件恢复到该状态。这使得用户能够可靠地恢复(即还原)具有由文件原生元数据定义的特定状态的所需文
件。换句话说,本公开的方法提供了对经受变更的文件的改进可搜索性,并在此后恢复此类文件。
[0018]在另一种实现方式中,文件类型指示对文件的编辑是仅追加(append

only)的。
[0019]在一种实现方式中,包括识别的方法包括通过分析随时间收集的文件元数据来确定预期的最后访问时间。
[0020]通过分析随时间收集的文件元数据来确定预期的最后访问时间,可以识别适合备份的文件,并减少要备份的数据或文件量以及在计划每日备份时间的备份期间花费的时间。
[0021]在一种实现方式中,多个剩余文件包括在提前备份窗口内未备份的文件。
[0022]该方法支持备本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于备份文件系统(202、710、814、914)的计算机实现的方法(100),所述方法(100)包括:处理器(812)接收提供提前备份时间窗口的用户输入,所述提前备份窗口在所述文件系统(202、710、814、914)的计划每日备份时间之前;所述处理器(812)识别所述文件系统(202、710、814、914)中适用于提前备份的一个或多个文件;所述处理器(812)在所述提前备份时间窗口内为所述一个或多个确定的文件启动提前备份;所述处理器(812)在所述计划每日备份时间为所述文件系统(202、710、814、914)中的多个剩余文件启动计划每日备份。2.根据权利要求1所述的方法(100),其中,识别包括分析文件元数据以识别自先前的计划每日备份时间以来已编辑的一个或多个文件。3.根据权利要求2所述的方法(100),还包括响应于文件编辑事件,所述处理器(812)从安装在所述文件系统(202、710、814、914)上的代理接收所述文件元数据。4.根据权利要求2所述的方法(100),还包括所述处理器(812)以预定时间间隔向所述文件系统(202、710、814、914)发送查询,并接收所述文件元数据作为响应。5.根据权利要求2至4中任一项所述的方法(100),其中,识别包括根据文件原生元数据确定每个文件的适用性,其中,所述文件原生元数据包括文件名、文件大小、文件用户权限、文件组权限、创建时间、最后访问时间、最后修改时间和文件类型中的一个或多个。6.根据权利要求5所述的方法(100),其中,所述文件类型指示对所述文件的编辑是仅追加的。7.根据权利要求2至6中任一项所述的方法(100),其中,识别包括通过分析随时间收集的文件元数据来确定预期的最后访问时间。8.根据上述权利要求中任一项所述的方法(100),其中,所述多个剩余文件包括在所述提前备份窗口内未备份的文件。9.根据上述权利要求中任一项所述的方法(100),其中,所述计划每日备份包括所述处理器(112)检查在所述提前备份窗口内备份的文件是否已被进一步编辑。10.根据上述权利要求中任一项所述的方法(100),其中,所述处理器(812)是文件系统服务器(810)的一部分,启动备份包括将所述文件发送到备份服务器(204、820)。11.根据权利要求1至9中任一项所述的方法(100),其中,所述处理器(812)是备份服务器(204、830)的一部分,启动备份包括从所述文件系统服务器(810)请求所述文件。12.一种计算机可读介质,用于存储指令,当由处理器(812)执行时,所述指令使所述处理器(812)执行上述权利要求中任一项所述的方法(100)。13.一种用于控制文件系统(2...

【专利技术属性】
技术研发人员:阿萨夫
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1