用于数据迁移的方法、设备和计算机程序产品技术

技术编号:21832443 阅读:21 留言:0更新日期:2019-08-10 17:55
本公开提出了一种用于迁移数据的方案。该方案中,首先由迁移工具接收来自源服务器的索引,该索引具有与存储在源服务器处的多个文件分别对应的索引值。迁移工具然后获取关键信息文件所对应的索引值在索引中的位置,关键信息文件包含针对多个文件的整体信息。迁移工具随后根据已获取的位置对索引进行排序。最后,迁移工具根据已排序的索引对多个文件进行处理,使得已排序的索引结构使得关键信息文件被最后处理。本公开的方案可以自动调整文件迁移的顺序,从而使得关键信息被最后处理。因此,即使关键信息在备份数据中的存储位置不在所期望的存储位置,也可以使得该关键信息被正确处理,以保证数据迁移的顺利进行。

Methods, devices and computer program products for data migration

【技术实现步骤摘要】
用于数据迁移的方法、设备和计算机程序产品
本公开的实施例涉及存储系统,并且更具体地涉及用于数据迁移的方法和设备。
技术介绍
目前,客户端的数据通常在服务器端进行备份。存储技术的不断进步使得存储系统的性能更佳、容量更大。有时,需要将数据从原有的存储系统或存储服务器迁移到更为先进的存储系统或存储服务器中。在对服务器处的数据进行迁移时,通常要把不同类型的服务器中所存储的数据的格式以及层次结构考虑在内,以使得数据迁移能够顺利进行。
技术实现思路
本公开的实施例提供用于数据迁移的方法、装置以及计算机程序产品。在本公开的第一方面,提供了一种用于数据迁移的方法,所述方法包括:接收来自源服务器的索引,所述索引具有与存储在所述源服务器处的多个文件分别对应的索引值;获取关键信息文件所对应的索引值在所述索引中的位置,所述关键信息文件包含针对所述多个文件的整体信息;根据已获取的所述位置对所述索引进行排序;以及根据已排序的索引对所述多个文件进行处理,使得已排序的所述索引结构使得所述关键信息文件被最后处理。在本公开的第二方面,提供了一种电子设备,所述电子设备包括处理器以及与所述处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被所述处理器执行时使得所述电子设备执行动作,所述动作包括:接收来自源服务器的索引,所述索引具有与存储在所述源服务器处的多个文件分别对应的索引值;获取关键信息文件所对应的索引值在所述索引中的位置,所述关键信息文件包含针对所述多个文件的整体信息;根据已获取的所述位置对所述索引进行排序;以及根据已排序的索引对所述多个文件进行处理,使得已排序的所述索引结构使得所述关键信息文件被最后处理。在本公开的第三方面,提供了一种计算机程序产品,所述计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,所述机器可执行指令在被执行时使所述机器执行本公开的第一方面的方法。提供
技术实现思路
部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。附图说明通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。图1示出了根据本公开的实施例的存储系统的框图;图2示出了根据本公开的实施例的数据存储结构的示意图;图3示出了根据本公开的实施例的另一数据存储结构的示意图;图4示出了根据本公开的实施例的用于数据迁移的方法的流程图;图5示出了根据本公开的实施例的哈希树搜索过程的示意图;以及图6示出了可以用来实施本公开内容的实施例的示例设备的示意性框图。具体实施方式下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。目前,客户端的数据通常在服务器端进行备份。在客户端存储的数据的量非常大。存储技术的不断进步使得存储系统的性能更佳、容量更大。有时,需要将数据从原有的存储系统或存储服务器迁移到更为先进的存储系统或存储服务器中。在对服务器处的数据进行迁移时,通常要把不同类型的服务器中所存储的数据的格式以及层次结构考虑在内,以使得数据迁移能够顺利进行。在数据存储服务器处,通常存储有关键信息。该关键信息也被成为系统信息,其对存储服务器处的文件的总体信息,诸如文件的大小、创建时间、存储路径。在关键信息的真实存储位置与预先期望的存储位置不同时,现有技术中的迁移逻辑可能发生崩溃。本公开的方法可以自动调整文件迁移的顺序,从而使得关键信息被最后处理。因此,即使关键信息在备份数据中的存储位置不在所期望的存储位置,也可以使得该关键信息被正确处理,以保证迁移的顺利进行。为了至少部分地解决上述问题以及其他潜在问题,本公开的示例实施例提供了一种用于迁移数据的方案。本公开的方案可以利用通用方式来处理不同存储类型的备份数据,而不需要针对不同存储类型的备份数据进行专门的更改,从而使得迁移逻辑更加清晰。应当理解,本公开的方案并非仅可用于迁移备份数据,而是可以适用于迁移任何类型的数据。本公开的方案可以使得迁移工具更为可靠。在本公开的方案中,迁移工具接收来自源服务器的索引,该索引具有与存储在源服务器处的多个文件分别对应的索引值。然后,迁移工具获取关键信息文件所对应的索引值在索引中的位置,关键信息文件包含针对多个文件的整体信息。随后,迁移工具根据已获取的位置对索引进行排序。迁移工具根据已排序的索引对多个文件进行处理,使得已排序的索引结构使得关键信息文件被最后处理。图1示出了根据本公开的实施例的存储系统100的框图。应当理解,仅出于示例性的目的描述存储系统100的结构和功能而不是暗示对于本公开的范围的任何限制。也即,存储系统100中的某些部件可被省略或替换,而另一些未示出的部件可被添加到存储系统100中。本公开的实施例可以被体现在不同的结构和/或功能中。本文中的存储系统100可以包括独立磁盘冗余阵列(RAID)。如图1所示,存储系统100包括源服务器110和目标服务器120。在源服务器110和目标服务器120之间存在数据接口130。数据接口130可以是有线连接或无线连接。源服务器110和目标服务器120之间的数据接口130为双向数据接口。备份数据存储在源服务器110上。可能希望将备份数据从源服务器110移动到目标服务器120上。因此需要引入迁移工具140,以完成从源服务器110到目标服务器120的备份数据移动。图1显示了典型的迁移情况,即通过数据接口130将数据从源服务器110迁移到目标服务器120。在某些实施例中,迁移工具140例如可以是软件实现的应用或称应用程序,其可以部署在源服务器110上、部署在目标服务120上、或者部署在源服务器110和目标服务器120两者上。作为非限制性的示例,迁移工具140被部署在目标服务器120上。备选地或者附加地,迁移工具140也可以由硬件、固件或者其组合实现。在源服务器110和目标服务器120的基础架构不同的情况下,备份数据在每个服务器上以不同的格式被存储。例如,目标服务器120可能是新型的数据存储服务器,诸如利用了集成数据域的服务器。迁移工具140遍历源服务器110上的备份数据,并且将备份数据转换为目标服务器120的期望格式,然后将数据备份到目标服务器120。在源服务器110中所存储的文件的层次结构可以是树形的。针对层次结构化文件,可以形成关键信息文件。该关键信息文件也可以成为系统信息文件,其包含了备份数据的整体信息,诸如文件的大小、创建时间、存储路径。在本文中,也将系统信息文件称本文档来自技高网
...

【技术保护点】
1.一种用于数据迁移的方法,所述方法包括:接收来自源服务器的索引,所述索引具有与存储在所述源服务器处的多个文件分别对应的索引值;获取关键信息文件所对应的索引值在所述索引中的位置,所述关键信息文件包含针对所述多个文件的整体信息;根据已获取的所述位置对所述索引进行排序;以及根据已排序的索引对所述多个文件进行处理,使得已排序的所述索引结构使得所述关键信息文件被最后处理。

【技术特征摘要】
1.一种用于数据迁移的方法,所述方法包括:接收来自源服务器的索引,所述索引具有与存储在所述源服务器处的多个文件分别对应的索引值;获取关键信息文件所对应的索引值在所述索引中的位置,所述关键信息文件包含针对所述多个文件的整体信息;根据已获取的所述位置对所述索引进行排序;以及根据已排序的索引对所述多个文件进行处理,使得已排序的所述索引结构使得所述关键信息文件被最后处理。2.根据权利要求1所述的方法,其中对所述多个文件进行处理包括:将所述多个文件转换成目标服务器所要求的格式。3.根据权利要求1所述的方法,其中所述索引是树,并且其中针对所述多个文件中的每个文件的索引值是针对所述每个文件而获得的哈希值。4.根据权利要求3所述的方法,其中获取所述关键信息文件所对应的所述索引值在所述索引中的所述位置包括:通过宽度优先遍历的方式来遍历所述索引。5.根据权利要求3所述的方法,其中所述索引中的索引值的类型包括原子索引值和复合索引值,所述原子索引值是针对所述多个文件中的每个文件被形成的,并且其中所述复合索引值是针对一个或多个原子索引值而被形成的。6.根据权利要求1所述的方法,还包括:针对已处理的每个文件生成新的索引值;根据已生成的所述新的索引值形成新的索引以便存储。7.根据权利要求1所述的方法,其中获取所述关键信息文件所对应的所述索引值在所述索引中的所述位置包括:通过解析索引值得到文件的名称或属性;确定所述文件的名称或属性是否与所述关键信息文件的名称或属性分别相同;响应于所述文件的名称或属性与所述关键信息文件的名称或属性分别相同,确定所述文件是所述关键信息文件。8.根据权利要求1所述的方法,其中所述多个文件的类型包括目录文件和数据文件。9.根据权利要求1所述的方法,其中所述关键信息文件的内容包括以下中的至少一项:所述多个文件中的所述每个文件的大小;所述多个文件中的所述每个文件的存储路径;所述多个文件中的所述每个文件的创建时间。10.一种电子设备,包括处理器以及与所述处理器耦合的存储器,所述存储器具有存储于其中的指令,所述指令在被所述处理器执行时使得所述电子设备执行动作,所述动作包括:接收来自源服务器的索引,...

【专利技术属性】
技术研发人员:王毅王磊郑庆霄郭永生李海涛赵靖荣
申请(专利权)人:伊姆西IP控股有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1