【技术实现步骤摘要】
【国外来华专利技术】用于去重复文件系统的备份和恢复系统以及对应的服务器和方法
本专利技术涉及管理存储在存储装置中的数据的方法。
技术介绍
近年来,存储在文件服务器中的数据量正快速增加。为了降低文件服务器的数据存储成本,能够降低存储在文件服务器中的文件数据的量的文件级去重复功能正在吸引着注意。文件级去重复功能通过从存储在文件服务器的文件系统中的文件群组之中提取具有重复数据体的重复文件群组、并删除除一个数据体之外的数据体以用参考数据取代数据体来实现。通过由多个文件共享该一个数据体,可以删除存储在文件系统中的冗余数据体。因此可以降低存储在文件系统中的数据量。同时,作为针对文件服务器故障或者灾难的对策,由已经向其应用文件级去重的文件系统管理的数据仍旧定期备份到磁带设备。例如,为了备份,可以使用网络数据管理协议。例如,US8,204,862B公开了用于恢复去重复数据的方法。该方法可以包括接收用于向客户端系统恢复去重复数据片段集合的请求,其中去重复数据片段集合中的每个数据片段由一个或者多个去重复参考来参考。方法还可以包括获得针对去重复数据片段集合中的每个数据片段指示指向数据片段的去重参考的数目的参考数据。方法还可以包括使用参考数据从去重复数据片段集合中选择一个或者多个片段用于客户端侧高速缓存、在客户端系统上的高速缓存中高速缓存一个或者多个数据片段、以及从客户端系统上的高速缓存恢复一个或者多个数据片段。还公开了各种其他方法、系统和计算机可读介质。此外,US8,200,926B公开了用于创建全备份的计算机实现的方法。该计算机实现方法可以包括在第一次时创建数据单元集合的第一全备份。计算机实现的 ...
【技术保护点】
一种计算机系统,包括:服务器,用于向客户端计算机提供数据;第一存储系统,用于存储将要向所述客户端计算机提供的所述数据;以及第二存储系统,用于备份存储在所述第一存储系统中的所述数据,其中所述服务器包括用于执行程序的处理器和用于存储由所述处理器执行的所述程序的存储器,所述第一存储系统存储与其他数据共享至少一部分数据的去重复数据、由多个所述去重复数据共享的共享数据、以及表示所存储的包括所述去重复数据和所述共享数据的所述数据的类型的第一类型数据,所述去重复数据通过指向所述共享数据的指针而与所述共享数据相关联,并且包括指示与所述共享数据的差异的差别数据,所述服务器从所述第一类型数据创建表示存储在所述第二存储系统中的所述数据的类型的第二类型数据,并且所述第二存储系统将与所述去重复数据相关联的所述共享数据存储在以按序读取的方式读取所述去重复数据的位置之前的读取位置处,并且存储所创建的所述第二类型数据。
【技术特征摘要】
【国外来华专利技术】1.一种用于备份数据的计算机系统,包括:服务器,用于向客户端计算机提供数据;第一存储系统,用于存储将要向所述客户端计算机提供的所述数据;以及第二存储系统,用于备份存储在所述第一存储系统中的所述数据,其中第一存储系统存储去重复数据和共享数据;其中第二存储系统执行顺序存取,并且所述顺序存取执行的比随机存取快;其中去重复数据包括第一数据头和第一数据体,所述第一数据头包括表示所述数据是所述去重复数据的第一类型数据和用于关联所述去重复数据到所述共享数据的参考信息,所述数据体包括指示与所述共享数据的差异的差别数据;其中所述共享数据包括第二数据头和第二数据体,所述第二数据头包括表示所述数据是所述共享数据的第二类型数据,所述第二数据体包括由多个所述去重复数据共享的所述共享数据;其中与所述去重复数据关联的所述共享数据被从所述第一存储系统备份到所述第二存储系统后所述服务器执行从所述第一存储系统备份所述去重复数据到所述第二存储系统,以使得所述共享数据顺序上先于与所述共享数据相关联的所述去重复数据定位;其中与备份的所述去重复数据相关联的备份的所述共享数据被恢复后所述服务器执行从所述第二存储系统恢复备份的所述去重复数据。2.根据权利要求1所述的计算机系统,其中所述第二存储系统存储将要被备份的多个所述共享数据,并且将与所述多个所述共享数据相关联的多个所述去重复数据存储在所述多个所述共享数据被存储的读取位置之后。3.根据权利要求2所述的计算机系统,其中所述服务器参考所述第一类型数据以提取将要被备份到所述第二存储系统的所述共享数据。4.根据权利要求1所述的计算机系统,其中所述服务器:参考所述第一类型数据以确定将要被备份到所述第二存储系统的所述数据是否是去重复数据;以及在将要被备份的所述数据是去重复数据的情况下,确定与所述去重复数据相关联的所述共享数据是否存储在了所述第二存储系统中,以及在所述共享数据未被存储在所述第二存储系统中的情况下,所述第二存储系统存储所述共享数据,并继而将所述去重复数据存储在所述共享数据的存储位置之后的读取位置处。5.根据权利要求1所述的计算机系统,其中所述服务器:执行存储在所述第二存储系统中的所述数据的所述顺序读取;参考所读取的所述第二类型数据以确定将要被存储在所述第一存储系统中的所述数据的所述类型;在将要被存储在所述第一存储系统中的所述数据是去重复数据的情况下,从所述第二存储系统获取参考信息;从关联所述去重复数据到所述共享数据的所述参考信息创建指向所述共享数据的指针;以及从读取自所述第二存储系统的所述数据创建所述去重复数据的所述差别数据;以及其中所述第一存储系统存储所创建的所述差别数据。6.根据权利要求1所述的计算机系统,其中服务器通过参考所述第一类型数据、所述第二类型数据和所述参考信息从所述第二存储系统恢复数据到所述第一存储系统。7.一种用于向客户端计算机提供数据的服务器,所述服务器包括:用于执行程序的处理器;以及用于存储由所述处理器执行的所述程序的存储器,其中第一存储系统存储去重复数据和共享数据;其中第二存储系统执行顺序存取,并且所述顺序存取执行的比随机存取快;其中去重复数据包括第一数据头和第一数据体,所述第一数据头包括表示所述数据是所述去重复数据的第一类型数据和用于关联所述去重复数据到所述共享数据的参考信息,所述第一数据体包括指示与所述共享数据的差异的差别数据;其中所述共享数据包括第二数据头和第二数据体,所述第二数据头包括表示所述数据是所述共享数据的第二类型数据,所述第二数据体包括由多个所述去重复数据共享的所述共享数据;其中所述服务器被配置为:与所述去重复数据关联的所述共享数据被从所述第一存储系统备份到所述第二存储系统后从所述第一存储系统备份所述去重复数据到所述第二存储系统,以使得所述共享数据顺序上先于与所述共享数据相关联的所述去重复数据定位;以及与备份的所述去重复数据相关联的备份的所述共享数据被恢复后从所述第二存储系统恢复备份的所述去重复数据。8.根据权利要求7所述的服务器,其中所述服务器被进一步配置为存储将要被备份到所述第二存储系统中的多个所述共享数据,并且在所述多个所述共享数据被存储的读取位置之后,将与所述多个所述共享数据相关联的多个所述去重复数据存储到所述第二存储系统中。9.根据权利要求8所述的服务器,其中所述服务器参考所述第一类型数据以提取将要被备...
【专利技术属性】
技术研发人员:龟井仁志,深谷崇元,榎阪智则,
申请(专利权)人:株式会社日立制作所,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。