对备份数据进行编目制造技术

技术编号:11284034 阅读:53 留言:0更新日期:2015-04-10 17:54
公开了对备份数据进行编目的方法和装置。对备份数据进行编目的示例方法包括当源服务器是离线的时,将所述备份数据从源服务器拷贝到数据存储库。响应于完成备份数据的拷贝,示例方法还包括将源服务器置于在线。示例方法还包括,当源服务器是在线的时对数据存储库中的备份数据进行编目,以完成备份数据到数据存储库的备份。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】公开了对备份数据进行编目的方法和装置。对备份数据进行编目的示例方法包括当源服务器是离线的时,将所述备份数据从源服务器拷贝到数据存储库。响应于完成备份数据的拷贝,示例方法还包括将源服务器置于在线。示例方法还包括,当源服务器是在线的时对数据存储库中的备份数据进行编目,以完成备份数据到数据存储库的备份。【专利说明】对备份数据进行编目
技术介绍
数据备份允许在稍后的时间恢复原始数据。例如,当原始数据丢失或被破坏时,它可以从备份数据中恢复。为了从备份数据中有效地恢复文件(或多个文件),在目录中创建了用于文件的目录条目。目录条目将文件或文件的属性映射到该文件的不同版本和在备份数据中的文件的版本的位置。 【专利附图】【附图说明】 图1示出了可以用于实现本文公开的示例的示例数据备份系统。 图2是图1的示例数据备份系统的详细图。 图3示出了可以用于将备份数据分布到多个存储服务器的示例分布式数据存储库。 图4是表示可以被执行来创建备份数据的机器可读指令的流程图。 图5是表示可以被执行来对备份数据进行编目的机器可读指令的流程图。 图6是表示可以被执行来将备份数据分布到多个存储服务器的机器可读指令的流程图。 图7是能够执行图4-图6的示例机器可读指令以实现图1-图3的示例系统的示例处理平台的框图。 【具体实施方式】 数据备份过程涉及在数据传送过程期间创建待备份的数据的拷贝或快照,并且在数据传送过程之后对备份数据进行编目。现有的备份系统在数据传送过程和编目过程期间将数据源(例如,待备份的计算机或服务器)放置于离线,并且不将数据源置于在线,直到这两个过程完成为止。与现有技术不同,本文公开的示例能够在数据源是离线的时执行数据传送,并且在将数据源置于在线之后执行编目。 在数据备份过程期间,使数据源服务器(例如,正被备份的客户端服务器)离线,使得当数据被拷贝到数据存储库(例如,其中,数据在数据拷贝过程期间被存储)时,文件不能由用户或其它过程修改。以这种方式,可以捕获在特定的时间点在数据源中的所有数据的状态的快照。这降低了由于用户或过程在备份过程期间修改文件而使备份数据成为不可用的或被破坏的可能性。也就是说,这样的文件修改可以使数据拷贝过程在备份过程的数据传送期间拷贝一个或多个文件的一些老数据和一些新数据。在编目过程期间,对备份数据编索引,以用于随后从数据存储库取回。在保持数据源离线同时执行数据拷贝过程和编目过程二者的现有系统中,当数据传送和编目过程二者都完成时,数据源在相对长的时间期间是离线的并且对于客户端而言是不可访问的。随着被备份和编目的数据的数量增加,所述不可访问的时间段增加。与现有系统不同,本文公开的示例通过在拷贝数据之后将数据源放置于在线,并且在数据源回到在线和对于客户端而言是可访问的时完成对备份数据的编目来缩短数据源在数据备份过程期间是离线的时间的量。通过执行编目作为背景过程,它可以在稍后的时间完成,同时比现有系统更快地使数据源对于客户端而言变得可用。 本文公开的示例还可以用于在多个存储服务器当中存储备份数据,以在访问备份数据时相对于现有系统的访问速度而提高了访问速度。在一些示例中,大型数据存储库可以在多个存储设备/服务器当中存储几百万兆字节的信息。在一些示例中,在数据存储库中使用具有不同的处理速度的不同类型的存储设备/服务器(例如,磁带设备、硬盘、光学存储设备等)。为了减少用于访问备份数据(例如,恢复和/或撤销备份数据)的访问时间,本文公开的示例可以用于基于例如每隔多久访问文件一次、文件的重要性等不时地对在多个存储服务器当中的备份数据进行重新平衡。通过监控在源服务器(例如,被备份的数据源)中多久访问一次不同的目录条目和/或文件,当访问那些被频繁访问的文件的备份拷贝时,在重新平衡操作期间可以将更频繁访问的文件存储在更快的处理存储服务器上,以提高访问速度。 图1示出了可以用于实现本文公开的示例的示例数据备份系统100。示例数据备份系统100包括源服务器102和数据存储库104。在一些示例中,源服务器102和/或数据存储库104可以包括多个设备。例如,源服务器102(例如,待备份的数据源)可以包括盘阵列(例如,包括多个盘驱动器的数据存储系统)或彼此通信的多个工作站(例如,桌上型计算机、工作站服务器、膝上型计算机等),和/或数据存储库104可以包括多个存储介质和/或本地服务器,例如,磁带设备、硬盘、光存储设备等。 在所示出的示例中,源服务器102与数据存储库104进行通信。例如,源服务器102可以经由例如有线或无线通信在例如数据总线、局域网(LAN)、无线网络等上与数据存储库104进行通信。如在本文中所使用的,包括变型的短语“在通信中”涵盖直接通信和/或通过一个或多个中间部件的间接通信。示例源服务器102在在线状态和离线状态中操作。当在在线状态中时,源服务器102可以由客户端访问,以用于读取和/或写入。在数据备份过程期间,当将数据从示例源服务器102拷贝到示例数据存储库104时,示例源服务器102是离线的,以能够在没有数据正在改变的特定的时间获取正被备份的数据的快照。例如,如果当示例源服务器102在线时,执行数据备份过程,则当文件夹正被备份时,文件可以在文件夹中被改变。作为结果,将不知道该文件的新版本是部分地、全部、或根本没有被备份,并且因此可能以后不可以从示例数据存储库104中正确地恢复。因此,数据的快照指从特定的日期/时间起在数据源中的所有文件的静态的、无变化状态的拷贝,类似于照片如何捕获在某一时间点处的场景。 在示出的示例中,在备份数据的拷贝或快照被存储在数据存储库104中之后,源服务器102被置于在线。在示出的示例中,当示例数据存储库104接收到数据的拷贝或快照时,示例数据备份系统100可以立即开始对备份数据进行编目,或它可以延迟对备份数据进行编目直到稍后的时间为止。例如,数据备份系统100可以在空闲时间段或以相对少使用的时间开始对备份数据进行编目。在一些示例中,适配器可以安装在示例数据备份系统100中,以相对于来自其它数据源的其它备份数据和/或相对于同样由数据存储库104执行的其它过程而优先考虑对备份数据进行编目(例如,创建目录条目)。例如,与金融机构相关的数据可以在来自最终用户的数据之前被编目。在其它示例中,与数据源中频繁被访问的文件相对应的备份数据可以在其它备份数据之前被编目。例如,已经存储在示例数据存储库中的更老的文件版本的新版本可以在更早的时候被备份,所以如果需要可以在目录生成完成之前访问它。 图2是图1的示例数据备份系统100的详细图。在图2示出的示例中,源服务器102包括源代理202和源盘204。示例源服务器102经由示例通信连接器208、示例迀移器216和示例编目器218来与示例数据存储库104进行通信。此外和/或可选地,示例源服务器102可以经由示例本地存储库206、示例元数据服务器228和示例编目器218来与示例数据存储库104进行通信。在图2的所示出的示例中,数据存储库104包括与目录数据库222进行通信的有效载荷数据库220,所述目录数据库222包括源模型数据库224和定位器数据226。示例元数据服务器228包括与示例元数据适配器本文档来自技高网...

【技术保护点】
一种对备份数据进行编目的方法,包括:当源服务器是离线的时,将所述备份数据从所述源服务器拷贝到数据存储库;响应于完成所述备份数据的拷贝,将所述源服务器置于在线;以及当所述源服务器是在线的时,对所述数据存储库中的所述备份数据进行编目,以完成将所述备份数据备份到所述数据存储库。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:A·施罗特B·卡普勒H·比罗斯K·V·苏布拉马尼亚姆
申请(专利权)人:惠普发展公司有限责任合伙企业
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1