数据处理方法、装置和计算机设备制造方法及图纸

技术编号:37487360 阅读:29 留言:0更新日期:2023-05-07 09:26
本申请涉及一种数据处理方法、装置和计算机设备。该方法包括:响应于元数据的操作请求,新集群网关确定目标集群,新集群网关向目标集群的名字节点发送操作请求,指示目标集群的名字节点执行元数据的操作。其中,目标集群包括新集群和/或新集群网关指向的老集群,新集群的目录元数据中已预先同步有老集群的目录元数据。采用本方法能够避免系统的资源浪费。数据。采用本方法能够避免系统的资源浪费。数据。采用本方法能够避免系统的资源浪费。

【技术实现步骤摘要】
数据处理方法、装置和计算机设备


[0001]本申请涉及计算机
,特别是涉及一种数据处理方法、装置和计算机设备。

技术介绍

[0002]随着大数据容量的迅猛发展,以HDFS为代表的分布式文件系统的数据容量、集群规模出现爆炸式的增值。此时,往往需要对新老系统的数据进行综合,完成集群的新老交替。
[0003]相关技术通过数据迁移指令distcp进行完整的数据迁移,具体是将老集群的数据全量复制到新集群提供服务,再下线老集群,最终完成集群的新老交替。
[0004]然而,相关技术迁移完毕后老集群下线,两个集群无法作为一个整体提供服务,存在资源浪费的问题。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够避免资源浪费的数据处理方法、装置和计算机设备。
[0006]第一方面,本申请提供了一种数据处理方法,该方法包括:
[0007]响应于元数据的操作请求,新集群网关确定目标集群;目标集群包括新集群和/或新集群网关指向的老集群;其中,新集群的目录元数据中已预先同步有老集群的目录元数据;...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:响应于元数据的操作请求,新集群网关确定目标集群;所述目标集群包括所述新集群和/或所述新集群网关指向的老集群;其中,所述新集群的目录元数据中已预先同步有所述老集群的目录元数据;所述新集群网关向所述目标集群的名字节点发送所述操作请求,指示所述目标集群的名字节点执行所述元数据的操作。2.根据权利要求1所述的方法,其特征在于,所述新集群网关中包括预先构建的用户连接池,所述用户连接池用于缓存访问所述老集群的名字节点的连接。3.根据权利要求1或2所述的方法,其特征在于,若在所述元数据的操作之后接收到数据传输的请求,则所述数据传输为所述新集群的名字节点或所述老集群的名字节点在各自的数据节点中进行的。4.根据权利要求1或2所述的方法,其特征在于,所述元数据为文件元数据,所述新集群网关确定目标集群包括:所述新集群网关检测所述老集群中是否存在所述文件元数据;若存在,所述新集群网关确定所述目标集群为所述老集群;若不存在,所述新集群网关确定所述目标集群为所述新集群。5.根据权利要求4所述的方法,其特征在于,所述目标集群的名字节点执行所述元数据的操作包括:若所述目标集群为所述老集群,则所述老集群的名字节点在所述老集群中维护所述文件元数据;若所述目标集群为所述新集群,则所述新集群的名字节点在所述新集群中创建所述文件元数据。6.根据权利要求1或2所述的方法,其特征在于,所述元数据为所述目录元数据,则所述新集群网关确定目标集群包括:所述新集群网关确定所述目标集群为所述新集群和所述老集群;相应地,所述目标集群的名字节点执行所述元数据的操作包括:所述新...

【专利技术属性】
技术研发人员:张林安培张鹏杨志欣张小勇
申请(专利权)人:天津中科曙光存储科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1