一种对象存储数据迁移的方法、装置、设备及介质制造方法及图纸

技术编号:32818172 阅读:13 留言:0更新日期:2022-03-26 20:14
本发明专利技术提供了一种对象存储数据迁移的方法、装置、设备及可读介质,该方法包括:响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。通过使用本发明专利技术的方案,能够显著提高数据迁移的性能和效率。著提高数据迁移的性能和效率。著提高数据迁移的性能和效率。

【技术实现步骤摘要】
一种对象存储数据迁移的方法、装置、设备及介质


[0001]本专利技术涉及计算机领域,并且更具体地涉及一种对象存储数据迁移的方法、装置、设备及可读介质。

技术介绍

[0002]在大数据时代,对象存储服务(Object Storage Service,OSS)是一种新兴的海量、安全、低成本、高可靠的存储服务,适合存放任意类型的文件。初期,用户会选择将海量的文件存储在云存储服务器上,但随着数据量越来越大,存储成本越来越高,往往会有将云存储服务器上的数据迁移至机房的分布式存储服务器中,也就是常说的“数据下云”,或者用户需要将自己的数据从一套存储服务器迁移到另外一套存储服务器上,都会涉及到对象存储集群之间的数据迁移。常用的数据迁移策略和服务都会选择以存储桶为单位进行迁移,但是该迁移策略耗时非常大,当存储桶内对象非常多时,list桶内对象的耗时会非常大,且迁移为先读后写的顺序,不能并发执行读写,只能一个个的顺序进行,所以效率并不是很高。

技术实现思路

[0003]有鉴于此,本专利技术实施例的目的在于提出一种对象存储数据迁移的方法、装置、设备及可读介质,通过使用本专利技术的技术方案,能够显著提高数据迁移的性能和效率。
[0004]基于上述目的,本专利技术的实施例的一个方面提供了一种对象存储数据迁移的方法,包括以下步骤:响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。
[0005]根据本专利技术的一个实施例,迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群包括:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。
[0006]根据本专利技术的一个实施例,还包括:响应于线程对应的对象写入到目的集群,将线程对应的索引分片信息标记为迁移完成。
[0007]根据本专利技术的一个实施例,还包括:
响应于所有的索引分片信息全部标记为迁移完成,确定存储桶中的数据迁移完成并启动下一个存储桶的数据迁移。
[0008]本专利技术的实施例的另一个方面,还提供了一种对象存储数据迁移的装置,装置包括:同步模块,同步模块配置为响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;创建模块,创建模块配置为获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移模块,迁移模块配置为迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。
[0009]根据本专利技术的一个实施例,迁移模块还配置为:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。
[0010]根据本专利技术的一个实施例,还包括标记模块,标记模块配置为:响应于线程对应的对象写入到目的集群,将线程对应的索引分片信息标记为迁移完成。
[0011]根据本专利技术的一个实施例,标记模块还配置为:响应于所有的索引分片信息全部标记为迁移完成,确定存储桶中的数据迁移完成并启动下一个存储桶的数据迁移。
[0012]本专利技术的实施例的另一个方面,还提供了一种计算机设备,该计算机设备包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述任意一项方法的步骤。
[0013]本专利技术的实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任意一项方法的步骤。
[0014]本专利技术具有以下有益技术效果:本专利技术实施例提供的对象存储数据迁移的方法,通过响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群的技术方案,能够显著提高数据迁移的性能和效率。
附图说明
[0015]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0016]图1为根据本专利技术一个实施例的对象存储数据迁移的方法的示意性流程图;图2为根据本专利技术一个实施例的对象存储数据迁移的装置的示意图;图3为根据本专利技术一个实施例的计算机设备的示意图;图4为根据本专利技术一个实施例的计算机可读存储介质的示意图。
具体实施方式
[0017]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。
[0018]基于上述目的,本专利技术的实施例的第一个方面,提出了一种对象存储数据迁移的方法的一个实施例。图1示出的是该方法的示意性流程图。
[0019]如图1中所示,该方法可以包括以下步骤:S1响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中。
[0020]S2获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程。
[0021]S3迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。
[0022]在新存储集群上(即目的端)部署迁移工具,以迁移一个存储桶为例,先将存储桶及其索引分片信息从旧存储集群(即源端)同步至新存储集群(即目的端)上,然后在目的端,迁移工具会根据桶索引分片个数N,并发起N个线程,读取桶索引分片上的对象信息,迁移工具有了对象信息后,从源端读取对象,写入到目的端,该过程为N个线程并发处理,互不影响。避免了全量list存储桶内对象的过程,同时以桶索引分片为基本单位,并发进行迁移,提高了数据迁移的速度。
[0023]通过本专利技术的技术方案,能够显著提高数据迁移的性能和效率。
[0024]在本专利技术的一个优选实施例中,迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群包括:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。...

【技术保护点】

【技术特征摘要】
1.一种对象存储数据迁移的方法,其特征在于,包括以下步骤:响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;获取存储桶的索引分片的数量,目的集群上的迁移工具根据存储桶的索引分片的数量创建相同数量的线程;迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群。2.根据权利要求1所述的方法,其特征在于,迁移工具控制每个线程分别读取一个索引分片信息,并根据索引分片信息将对应的对象写入目的集群包括:迁移工具控制每个线程分别读取一个索引分片信息,并将索引分片信息进行解析以得到索引分片对应的对象名称信息和存储路径信息;线程基于存储路径信息访问源端,并获取名称信息对应的对象;将获取到的对象写入目的集群中。3.根据权利要求1所述的方法,其特征在于,还包括:响应于线程对应的对象写入到目的集群,将线程对应的索引分片信息标记为迁移完成。4.根据权利要求3所述的方法,其特征在于,还包括:响应于所有的索引分片信息全部标记为迁移完成,确定存储桶中的数据迁移完成并启动下一个存储桶的数据迁移。5.一种对象存储数据迁移的装置,其特征在于,所述装置包括:同步模块,所述同步模块配置为响应于接收到数据迁移的指令,将源端的存储桶信息和存储桶的索引分片信息同步到目的集群中;创建模块,所述创建模块配置为获取存储桶的索引分片的数量,目的集群...

【专利技术属性】
技术研发人员:陶桐桐武模仁
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1