基线安装的备份制造技术

技术编号:13709286 阅读:67 留言:0更新日期:2016-09-15 18:47
一种备份计算设备的方法,包括:在计算设备的任何首次备份之前,将选择的预先填入的引用文件存储在计算设备中,该引用文件包括对被存储在计算设备中的数据块中的至少一些数据块的一个或多个引用。然后,可以发起首次备份。首次备份可以使对计算设备中的未被表示在预先填入的引用文件中的数据块的引用被添加到引用文件。然后,与所添加的引用相对应的数据块可以通过计算机网络被发送至备份服务器。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
随着企业数据增长的加速,各组织奋力寻找更有效的方式来管理该数据。一种用于控制数据增长的新兴的方法是删除重复数据。删除重复数据技术与备份尤其有关,因为尽管小心地使用差异和增量式备份策略,但是一部分备份仍然包括重复的数据。附图说明图1是在其中可以实施实施例的环境的框图。图2是示出了一个实施例的方面的框图。图3是示出了一个实施例的方面的框图。图4是根据一个实施例的方法的流程图。具体实施方式当发布/出售新的计算设备(包括但不限于:例如,台式计算机、膝上型计算机、平板计算机、智能手机、服务器、网络附加存储(NAS))时,其通常具有操作系统(例如,Windows或Mac OS)和多个应用。在该方面中,新发布的或出售的计算设备可能是与另一个计算设备非常相似的计算设备。例如,在企业市场中,由IT部门新发布的计算设备可以具有诸如微软Windows的操作系统、某个数据库软件、电子邮件客户端和工作效率套件。由于很多数据通常已经被存储在新的或新配置的计算设备上,所以就时间和带宽二者而言,对其的初始完全备份是代价高昂的。在数据被存储、备份或归档时,删除重复(还被称为“重复数据删除技术(dedupe)”)去除重复的信息。重复数据删除技术过程可以按照文件级和/或按照子文件或字节级执行,在按照文件级执行时,重复的文件是利用指向文件的一个副本的标记符来代替的,在按照子文件或字节级执行时,重复的数据字节被删除并且被引用所代替,导致存储容量需求的显著减少。删除重复数据是一种通过识别和消除冗余数据来减少数据量的技术。为了支持基于数据块的删除重复,早期的用于单一实例存储的基于文件粒度的删除重复的技术大部分已经消失,在基于数据块的删除重复中,文件被表示为多个块。将文件的每个数据块与已知的数据块进行比较。如果数据块先前已经被存储,那么该数据块就仅仅被引用,而不是被再次存储。然后,被存储仅一次的每个数据块可以使用编码技术来压缩。图1是在其中可以实施实施例的示例性环境的框图。如其中示出的,服务器(例如,备份服务器)62可以被耦合或者以其它方式被配置为接入网络60。服务器62可以如图1中示出的直接地或通过网络60被耦合至存储64。存储64可以包括非暂时性的有形存储,其包括例如,硬盘驱动器、固态存储,或者包括硬盘和固态存储二者的混合存储。存储64可以被配置例如作为网络附加存储(NAS)、直接附加存储(DAC)、独立磁盘冗余阵列(RAID),和/或可以被不同地配置。根据一个实施例,存储64可以被配置为存储备份,而服务器62可以被配置为处理备份或者以其它方式执行或体现本文描述的功能。在52、54和56处示出了多个客户端计算设备。计算设备52、54和56可以通过网络60被耦合至备份服务器。根据一个实施例,计算设备52、54和56可以被配置为向备份服务器62发送要被备份的数据的数据块,用于进行处理。计算设备52、54或56中的一个或多个可以被耦合至如58处示出的外部存储。例如,外部存储58可以被配置作为NAS、DAC或RAID,并且可以被直接地耦合至计算设备或可以通过网络60由计算设备可访问。计算设备52、54和56的任何一个还可以被配置为处理备份,或者以其它方式执行或体现本文描述的功能。计算设备52、54、56和/或备份服务器62可以包括例如与处理器202相通信的存储器203。处理器202可以被耦合至存储,所述存储可以包括例如,磁盘或其它旋转介质、非易失性半导体存储器或其混合。根据一个实施例,处理器202可以被配置为执行指令序列,所述指令序列实现本文描述和示出的功能和方法。图2是示出了一个实施例的方面的框图。如其中示出的,每个备份客户端(例如,图1中的计算设备52-56)可以存储或以其它方式使用引用文件,所述引用文件包括对数据块的引用。在服务器侧,这些数据块可以被存储在唯一数据块池102中。根据一个实施例,这些引用包括块标识符(下
文的块ID)。根据一个实施例,引用文件可以包括块ID(其可以包括例如,复数多项式和哈希值的结果,例如,MD5)和大小。由于在标识符与唯一的数据块之间存在一一对应的关系,所以唯一的块ID可以被配置,使得它们尽可能地全局唯一。然而,相同的数据块可以被标识有相同的块标识符。然而,在一个实施例中,单一的块ID一定不能指代两个或更多个不同的数据块。实施例存储引用(在一个实施例中是块ID),其引用被存储在备份客户端上的引用文件中的单独存储的块,而不是哪怕将数据的压缩版本作为备份存储在客户端或服务器上。相似的但是不同的引用文件可以被存储在如102处示出的服务器侧。例如并且参照图2,第一备份客户端可以存储引用文件1,其可以包括对块B21、B13、B18、B51和B2的引用。这些块可以不被存储在客户端中,但是可以被存储在图2的服务器侧处的唯一数据块池102中。唯一数据块池102可以被存储在备份服务器中,或者可以通过计算机网络以其它方式对于备份服务器可访问。例如,注意到的是,对数据块2的引用(BLKID2)存在于备份客户端1和3二者的引用文件中。然而,唯一块池102不需要存储数据块2的两个实例。实际上,唯一数据块池102可以被配置为包括引用文件内的各引用所引用的每个唯一块的单一实例。唯一数据块池102内的块中的一个或多个块可以在引用文件中被提及一次,并且唯一数据块池102内的块中的一个或多个块可以在一个以上的引用文件中被提及或表示。例如,与备份客户端1和备份客户端3相关联的引用文件1和引用文件3二者存储对块B2的引用,块B2的单一实例被存储在唯一数据块池102中。在图2中示出的客户端侧中的每个备份客户端处创建并且适当地更新单一引用文件。以该方式,引用文件1可以与第一备份客户端相关联,引用文件2可以与第二备份客户端相关联,引用文件3可以与第三备份客户端相关联以及引用文件4可以与第四备份客户端相关联,依此类推。服务器侧还可以存储或使用如104处示出的引用文件。然而,服务器侧的引用文件104可以被配置地与备份客户端中的每个中的引用文件稍微不同。虽然每个备份客户端的引用文件可以包括对每个备份的数据块的引用(例如,BKLID),但是服务器侧的引用文件可以被配置为既包括对数据块的引用(例如,BLKID),也包括针对每个被表示的数据块的指针或对唯
一数据块池102内的位置的其它引用(例如,偏移)。唯一数据块池内的每个数据块的位置使得备份服务器能够很容易地随意从唯一数据块池102取回数据块。根据一个实施例,备份客户端引用文件和服务器侧引用文件可以被保持同步,使得备份客户端的引用文件中的每个BLKID在服务器引用文件104中具有相应的条目。如果不再是这样的情况,备份客户端引用文件可以通过重新扫描客户端计算设备并且重新生成备份客户端引用文件来重建。在将计算设备分配给新员工之前,IT部门可以将计算设备装备有操作系统、一个或多个数据库应用、浏览器、电子邮件客户端和工作效率套件。要被运送给消费者的新的计算设备也可以被类似地配置。在将计算设备交付给其预期的接受者之前或之后,该初始配置可以被调度用于初始备份。这样的计算设备的初始备份可能是相当冗长的,因为其是完全备份。实际上,初始备份可以不仅备份计算设备的操作系统,而且备份被供应给本文档来自技高网
...

【技术保护点】
一种备份包括多个数据块的计算设备的方法,包括:在对所述计算设备的首次备份之前,将选择的预先填入的引用文件存储在所述计算设备中,所述选择的预先填入的引用文件包括对所述数据块中的至少一些数据块的一个或多个引用;以及通过下列操作发起对所述计算设备的所述首次备份:将对所述计算设备中的未被表示在所述预先填入的引用文件中的数据块的引用添加到所述引用文件;以及通过计算机网络,将与所添加的引用相对应的所述数据块发送到备份服务器。

【技术特征摘要】
【国外来华专利技术】2014.01.31 US 61/934,355;2014.04.07 US 14/246,7061.一种备份包括多个数据块的计算设备的方法,包括:在对所述计算设备的首次备份之前,将选择的预先填入的引用文件存储在所述计算设备中,所述选择的预先填入的引用文件包括对所述数据块中的至少一些数据块的一个或多个引用;以及通过下列操作发起对所述计算设备的所述首次备份:将对所述计算设备中的未被表示在所述预先填入的引用文件中的数据块的引用添加到所述引用文件;以及通过计算机网络,将与所添加的引用相对应的所述数据块发送到备份服务器。2.如权利要求1所述的方法,其中,所述首次备份是用于仅仅备份对其的引用不存在于所述选择的预先填入的引用文件中的那些数据块的增量备份。3.如权利要求2所述的方法,其中,所述增量备份是在无需执行初始完全备份的情况下发起的。4.如权利要求1所述的方法,其中,存储所述选择的预先填入的引用文件在无需通过所述网络将所述计算设备的所述数据块中的任何数据块发送到所述备份服务器的情况下,将所述计算设备的所述数据块中的至少一些数据块备份到所述备份服务器。5.如权利要求1所述的方法,其中,在所述首次备份被发起之前,所述备份服务器包括唯一数据块池,所述唯一数据块池包括由被存储在所述计算设备中的所述选择的预先填入的引用文件中的所述一个或多个引用所引用的数据块。6.如权利要求1所述的方法,还包括根据所述计算设备的配置,从多
\t个预先存在的和预先填入的引用文件中选择所述预先填入的引用文件。7.如权利要求1所述的方法,其中,对所述数据块中的至少一些数据块的所述一个或多个引用包括对被存储在所述计算设备上的操作系统、应用程序和用户数据中的至少一项的数据块的引用。8.如权利要求1所述的方法,其中,添加包括将比已经存在于所述引用文件中的更少的对所述计算设备的数据块的引用添加到所述引用文件。9.如权利要求1所述的方法,其中,存储所述选择的预先填入的引用文件是在由其预期的用户使用所述计算设备之前执行的。10.如权利要求1所述的方法,其中,发起对所述计算设备的所述首次备份是在将所述计算设备交付给其预期的用户之后、在先前未存在于所述计算设备中的数据块已经被创建在所述计算设备中之后执行的。11.如权利要求1所述的方法,其中,发送包括在所述首次备份期间,通过所述计算机网络仅仅将与所添加的引用相对应的所述数据块发送到所述备份服务器。12.一种包括多个数据...

【专利技术属性】
技术研发人员:T·拉姆W·H·埃文斯
申请(专利权)人:西部数据技术公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1