用于去重复文件系统的备份和恢复系统以及对应的服务器和方法技术方案

技术编号:11404063 阅读:80 留言:0更新日期:2015-05-03 20:07
提供一种计算机系统,包括服务器和第一存储系统和第二存储系统。第一存储系统存储与其他数据共享数据的至少一部分的去重复数据、由多个去重复数据共享的共享数据、以及表示所存储的包括去重复数据和共享数据的数据的类型的第一类型数据。去重复数据通过指向共享数据的指针而与共享数据相关联,并且包括指示与共享数据的差异的差别数据。服务器从第一类型数据创建表示存储在第二存储系统中的数据的类型的第二类型数据。第二存储系统将与去重复数据相关联的共享数据存储在以按序读取的方式读取去重复数据的位置之前的读取位置处,并且存储所创建的第二类型数据。

【技术实现步骤摘要】
【国外来华专利技术】用于去重复文件系统的备份和恢复系统以及对应的服务器和方法
本专利技术涉及管理存储在存储装置中的数据的方法。
技术介绍
近年来,存储在文件服务器中的数据量正快速增加。为了降低文件服务器的数据存储成本,能够降低存储在文件服务器中的文件数据的量的文件级去重复功能正在吸引着注意。文件级去重复功能通过从存储在文件服务器的文件系统中的文件群组之中提取具有重复数据体的重复文件群组、并删除除一个数据体之外的数据体以用参考数据取代数据体来实现。通过由多个文件共享该一个数据体,可以删除存储在文件系统中的冗余数据体。因此可以降低存储在文件系统中的数据量。同时,作为针对文件服务器故障或者灾难的对策,由已经向其应用文件级去重的文件系统管理的数据仍旧定期备份到磁带设备。例如,为了备份,可以使用网络数据管理协议。例如,US8,204,862B公开了用于恢复去重复数据的方法。该方法可以包括接收用于向客户端系统恢复去重复数据片段集合的请求,其中去重复数据片段集合中的每个数据片段由一个或者多个去重复参考来参考。方法还可以包括获得针对去重复数据片段集合中的每个数据片段指示指向数据片段的去重参考的数目的参考数据。方法还可以包括使用参考数据从去重复数据片段集合中选择一个或者多个片段用于客户端侧高速缓存、在客户端系统上的高速缓存中高速缓存一个或者多个数据片段、以及从客户端系统上的高速缓存恢复一个或者多个数据片段。还公开了各种其他方法、系统和计算机可读介质。此外,US8,200,926B公开了用于创建全备份的计算机实现的方法。该计算机实现方法可以包括在第一次时创建数据单元集合的第一全备份。计算机实现的方法还可以包括标识数据单元集合中的、自从第一次之后已经被修改的一个或者多个数据单元。计算机实现的方法可以进一步包括通过提供自从第一次之后已经被修改的一个或者多个数据的拷贝并且自从第一次之后未被修改的数据单元集合中存储对一个或者多个数据单元的参考来创建数据单元集合的第二全备份。参考可以被配置使得第二全备份是独立于任何其他备份的独立备份。
技术实现思路
技术问题根据上文所描述的传统技术,当文件服务器的管理员使用网络数据管理协议在文件级上向磁带备份已经向其应用文件级去重复的文件系统时,去重复状态被释放并且备份数据取得去重复前的状态。另一方面,当使用US8,204,862B描述的技术时,去重复文件系统的文件可以被备份和恢复到去重复状态。然而,US8,204,862B描述的技术并不考虑磁带设备的特性。因此,当US8,204,862B描述的技术被应用到使用磁带设备的备份和恢复时,磁带设备的寻找操作在恢复文件时频繁发生。磁带的寻找操作是指用于提示将要访问的文件的过程。磁带设备的寻找操作花费很长时间,这导致延长的恢复时间的问题。上文所描述的传统技术并不考虑向磁带备份,并且因此不能解决这样的问题。因此,本专利技术的一个目的是在已经向其应用文件级去重的文件系统中以去重状态向磁带设备备份文件,由此抑制在恢复中磁带设备的寻找操作。问题的解决方案在本主题申请所公开的专利技术的代表性示例中,磁带设备在去重复数据前存储与去重复数据相关联的共享数据。这是一种计算机系统,包括用于向客户端计算机提供数据的服务器;用于存储将要向客户端计算机提供的数据的第一存储系统;以及用于备份在第一存储系统中存储的数据的第二存储系统。服务器包括用于执行程序的处理器和用于存储由处理器执行的程序的存储器。第一存储系统存储与其他数据共享至少一部分数据的去重复数据、由去重复数据的多个片共享的共享数据、以及表示包括去重复数据和共享数据的存储的数据的类型的第一类型数据。去重复数据通过指向共享数据的指针与共享数据相关联,并且包括指示与共享数据的差异的差别数据。服务器从第一类型数据创建表示在第二存储系统中存储的数据的类型的第二类型数据。第二存储系统将与去重复数据相关联的共享数据存储在以按序读取的方式读取去重复数据的位置之前的读取位置处,并且存储创建的第二类型数据。本专利技术的有益效果根据本专利技术的示例性实施例,可以减少备份时间和恢复时间。附图说明[图1]图1是图示根据本专利技术的第一实施例的文件共享系统的配置示例的图。[图2A]图2A是图示根据本专利技术的第一实施例的客户端的配置示例的框图。[图2B]图2B是图示根据本专利技术的第一实施例的备份服务器的配置示例的框图。[图3A]图3A是图示根据本专利技术的第一实施例的管理终端的配置示例的框图。[图3B]图3B是图示根据本专利技术的第一实施例的文件服务器的配置示例的框图。[图4A]图4A是图示根据本专利技术的第一实施例的磁盘存储装置的配置示例的框图。[图4B]图4B是图示根据本专利技术的第一实施例的磁带设备的配置示例的框图。[图5]图5是图示根据本专利技术的第一实施例的在磁盘存储装置中存储的去重复文件群组的配置示例的图。[图6]图6是图示根据本专利技术的第一实施例的在磁带设备的磁带中存储的数据结构的图。[图7]图7是示意性图示根据本专利技术的第一实施例的在磁带中存储的备份数据的创建的图。[图8]图8是图示根据本专利技术的第一实施例的提取的文件列表的配置的图。[图9]图9是根据本专利技术的第一实施例的备份过程的流程图。[图10]图10是根据本专利技术的第一实施例的恢复过程的流程图。[图11]图11是图示根据本专利技术的第二实施例的文件服务器的配置示例的框图。[图12]图12是图示根据本专利技术的第二实施例的存储的共享数据文件列表的配置的图。[图13]图13是图示根据本专利技术的第二实施例的在磁带设备的磁带中存储的数据结构的图。[图14]图14是根据本专利技术的第二实施例的备份过程的流程图。[图15]图15是根据本专利技术的第二实施例的去重复文件备份过程的流程图。具体实施方式首先概述本专利技术的实施例。在本专利技术的代表性的实施例中,已经在文件级上去重复的文件群组(去重复文件群组)通过参考存储共享数据体的文件(共享数据存储文件)来共享一个数据体。在实施例中,首先,将所有共享的数据存储文件从已经向其应用文件级去重复功能的文件系统备份到磁带设备。之后,去重复文件和普通文件被备份到磁带设备。这时,指向共享数据存储文件的参考数据被写入到去重复文件的头数据中。在恢复中,共享数据存储文件被恢复,并继而去重复文件和普通文件被恢复。在恢复去重复文件的过程中,从去重复文件的头数据获取共享数据存储文件的路径,并且对共享数据存储文件的参考基于路径被设置到所恢复的去重复文件。通过上述过程,文件可以以去重复状态被备份到磁带设备,由此抑制磁带设备在恢复中的寻找操作。一种根据本专利技术的系统包括用于向终端用户提供文件共享服务的文件服务器、文件服务器在其中存储文件数据的磁盘存储装置、文件服务器在其中备份文件数据的磁带设备、用于向文件服务器发出备份指令的备份服务器、以及用于管理系统的管理终端。该系统被耦合到由终端用户使用的客户端。当从备份服务器的备份服务器程序接收到备份请求时,文件服务器的备份系统从存储在磁盘存储装置中的文件系统卷读取文件数据。然后,备份程序向磁带设备发送读取的文件的数据。磁带设备向磁带写入接收的数据。这时,备份程序首先向磁带设备发送共享数据存储文件,用于将文件系统备份到磁带。在共享数据存储文件的备份完成后,备份程序向磁带设备发送去重复文件和普通文件的数据,用于向磁带备份。另一方面,本文档来自技高网
...
用于去重复文件系统的备份和恢复系统以及对应的服务器和方法

【技术保护点】
一种计算机系统,包括:服务器,用于向客户端计算机提供数据;第一存储系统,用于存储将要向所述客户端计算机提供的所述数据;以及第二存储系统,用于备份存储在所述第一存储系统中的所述数据,其中所述服务器包括用于执行程序的处理器和用于存储由所述处理器执行的所述程序的存储器,所述第一存储系统存储与其他数据共享至少一部分数据的去重复数据、由多个所述去重复数据共享的共享数据、以及表示所存储的包括所述去重复数据和所述共享数据的所述数据的类型的第一类型数据,所述去重复数据通过指向所述共享数据的指针而与所述共享数据相关联,并且包括指示与所述共享数据的差异的差别数据,所述服务器从所述第一类型数据创建表示存储在所述第二存储系统中的所述数据的类型的第二类型数据,并且所述第二存储系统将与所述去重复数据相关联的所述共享数据存储在以按序读取的方式读取所述去重复数据的位置之前的读取位置处,并且存储所创建的所述第二类型数据。

【技术特征摘要】
【国外来华专利技术】1.一种用于备份数据的计算机系统,包括:服务器,用于向客户端计算机提供数据;第一存储系统,用于存储将要向所述客户端计算机提供的所述数据;以及第二存储系统,用于备份存储在所述第一存储系统中的所述数据,其中第一存储系统存储去重复数据和共享数据;其中第二存储系统执行顺序存取,并且所述顺序存取执行的比随机存取快;其中去重复数据包括第一数据头和第一数据体,所述第一数据头包括表示所述数据是所述去重复数据的第一类型数据和用于关联所述去重复数据到所述共享数据的参考信息,所述数据体包括指示与所述共享数据的差异的差别数据;其中所述共享数据包括第二数据头和第二数据体,所述第二数据头包括表示所述数据是所述共享数据的第二类型数据,所述第二数据体包括由多个所述去重复数据共享的所述共享数据;其中与所述去重复数据关联的所述共享数据被从所述第一存储系统备份到所述第二存储系统后所述服务器执行从所述第一存储系统备份所述去重复数据到所述第二存储系统,以使得所述共享数据顺序上先于与所述共享数据相关联的所述去重复数据定位;其中与备份的所述去重复数据相关联的备份的所述共享数据被恢复后所述服务器执行从所述第二存储系统恢复备份的所述去重复数据。2.根据权利要求1所述的计算机系统,其中所述第二存储系统存储将要被备份的多个所述共享数据,并且将与所述多个所述共享数据相关联的多个所述去重复数据存储在所述多个所述共享数据被存储的读取位置之后。3.根据权利要求2所述的计算机系统,其中所述服务器参考所述第一类型数据以提取将要被备份到所述第二存储系统的所述共享数据。4.根据权利要求1所述的计算机系统,其中所述服务器:参考所述第一类型数据以确定将要被备份到所述第二存储系统的所述数据是否是去重复数据;以及在将要被备份的所述数据是去重复数据的情况下,确定与所述去重复数据相关联的所述共享数据是否存储在了所述第二存储系统中,以及在所述共享数据未被存储在所述第二存储系统中的情况下,所述第二存储系统存储所述共享数据,并继而将所述去重复数据存储在所述共享数据的存储位置之后的读取位置处。5.根据权利要求1所述的计算机系统,其中所述服务器:执行存储在所述第二存储系统中的所述数据的所述顺序读取;参考所读取的所述第二类型数据以确定将要被存储在所述第一存储系统中的所述数据的所述类型;在将要被存储在所述第一存储系统中的所述数据是去重复数据的情况下,从所述第二存储系统获取参考信息;从关联所述去重复数据到所述共享数据的所述参考信息创建指向所述共享数据的指针;以及从读取自所述第二存储系统的所述数据创建所述去重复数据的所述差别数据;以及其中所述第一存储系统存储所创建的所述差别数据。6.根据权利要求1所述的计算机系统,其中服务器通过参考所述第一类型数据、所述第二类型数据和所述参考信息从所述第二存储系统恢复数据到所述第一存储系统。7.一种用于向客户端计算机提供数据的服务器,所述服务器包括:用于执行程序的处理器;以及用于存储由所述处理器执行的所述程序的存储器,其中第一存储系统存储去重复数据和共享数据;其中第二存储系统执行顺序存取,并且所述顺序存取执行的比随机存取快;其中去重复数据包括第一数据头和第一数据体,所述第一数据头包括表示所述数据是所述去重复数据的第一类型数据和用于关联所述去重复数据到所述共享数据的参考信息,所述第一数据体包括指示与所述共享数据的差异的差别数据;其中所述共享数据包括第二数据头和第二数据体,所述第二数据头包括表示所述数据是所述共享数据的第二类型数据,所述第二数据体包括由多个所述去重复数据共享的所述共享数据;其中所述服务器被配置为:与所述去重复数据关联的所述共享数据被从所述第一存储系统备份到所述第二存储系统后从所述第一存储系统备份所述去重复数据到所述第二存储系统,以使得所述共享数据顺序上先于与所述共享数据相关联的所述去重复数据定位;以及与备份的所述去重复数据相关联的备份的所述共享数据被恢复后从所述第二存储系统恢复备份的所述去重复数据。8.根据权利要求7所述的服务器,其中所述服务器被进一步配置为存储将要被备份到所述第二存储系统中的多个所述共享数据,并且在所述多个所述共享数据被存储的读取位置之后,将与所述多个所述共享数据相关联的多个所述去重复数据存储到所述第二存储系统中。9.根据权利要求8所述的服务器,其中所述服务器参考所述第一类型数据以提取将要被备...

【专利技术属性】
技术研发人员:龟井仁志深谷崇元榎阪智则
申请(专利权)人:株式会社日立制作所
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1