一种hadoop集群数据同步方法技术

技术编号:40314276 阅读:16 留言:0更新日期:2024-02-07 20:55
本发明专利技术提供的hadoop集群数据同步方法,是通过源端集群配置待同步表、依赖的源端集群调度和同步频次;在达到同步频次时,通过目标端集群执行依赖的源端集群调度判断,并生成第一判断结果;通过目标端集群根据第二判断结果执行待同步表的结构判断,并生成第二判断结果;通过目标端集群根据第二判断结果执行待同步表的数据同步。相比于现有技术,本发明专利技术依次执行待同步表的结构同步和待同步表的数据同步,表结构的更改的数据同步,不再需要人工介入;目标端集群执行数据同步,使用的是目标端集群的资源,不占用源端集群的资源,降低了人工成本和资源消耗,提高了同步效率。

【技术实现步骤摘要】

本专利技术涉及计算机网络,特别是涉及一种hadoop集群数据同步方法


技术介绍

1、建设数据平台的过程中,随着业务的增长,集群规模的扩大,以及软硬件环境的升级,不可避免的会遇到如集群数据迁移,合并等工作。

2、在大数据领域,通常会存在两套或多套hadoop集群(离线),一套源端集群,一套或多套目标端集群。两套集群的表范围存在差异,通常目标端集群的表范围是源端集群表的子集,对于相同的表目标端集群的数据需要跟源集群保持一致。源端集群的数据,一般来自于业务系统数据库,如mysql等,对应的,需要在源端集群配置业务数据同步调度,同步前应判断待同步数据是否已就绪。

3、目前,在确保目标端集群的数据,跟源端集群的数据保持完全一致的数据同步方法中,大多专注于表数据同步,忽视了表结构同步。

4、因此,提供一种可以同时关注表结构和表数据同步的hadoop集群数据同步方法是本领域技术人员亟待解决的问题。


技术实现思路

1、本专利技术的目的在于提供一种hadoop集群数据同步方法,,该方法逻辑本文档来自技高网...

【技术保护点】

1.一种hadoop集群数据同步方法,其特征在于,包括如下步骤:

2.如权利要求1所述的hadoop集群数据同步方法,其特征在于,所述目标端集群执行源端集群调度判断,包括如下步骤:

3.如权利要求2所述的hadoop集群数据同步方法,其特征在于,所述第一判断结果包括:判断是否存在所述依赖的源端集群调度的判断结果为否与判断所述依赖的源端集群调度是否成功的判断结果为是。

4.如权利要求1所述的hadoop集群数据同步方法,其特征在于,所述目标端集群执行所述待同步表的结构判断,包括如下步骤:

5.如权利要求4所述的hadoop集群数据同步方法,其...

【技术特征摘要】

1.一种hadoop集群数据同步方法,其特征在于,包括如下步骤:

2.如权利要求1所述的hadoop集群数据同步方法,其特征在于,所述目标端集群执行源端集群调度判断,包括如下步骤:

3.如权利要求2所述的hadoop集群数据同步方法,其特征在于,所述第一判断结果包括:判断是否存在所述依赖的源端集群调度的判断结果为否与判断所述依赖的源端集群调度是否成功的判断结果为是。

4.如权利要求1所述的hadoop集群数据同步方法,其特征在于,所述目标端集群执行所述待同步表的结构判断,包括如下步骤:

5.如...

【专利技术属性】
技术研发人员:刘志超李尼科潘斌何培康谭磊陈梦晨
申请(专利权)人:湖南长银五八消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1