一种数据同步的方法、系统、计算设备及存储介质技术方案

技术编号：24455059 阅读：44 留言：0更新日期：2020-06-10 15:18

本发明专利技术公开了一种数据同步的方法，包括以下步骤：在Azkaban中封装自定义任务类型；配置数据的同步信息，同步信息包括原始数据源、数据名称、目标数据源；根据同步信息和自定义任务类型生成调度任务；执行调度任务完成数据同步。本发明专利技术公开的数据同步的方法，可实现数据同步的分布式计算、高效稳定，适用于高吞吐、大并发的数据场景。本发明专利技术还提供了一种数据同步的的系统、计算设备及存储介质。

A method, system, computing equipment and storage medium of data synchronization

全部详细技术资料下载

【技术实现步骤摘要】
一种数据同步的方法、系统、计算设备及存储介质
本专利技术涉及大数据处理领域，特别涉及一种数据同步的方法、系统、计算设备及存储介质。
技术介绍
目前，在大数据时代，数据具有海量、高增长、多样化等特点，在实际的大数据处理中，常常需要将一个系统中的数据变化及时的同步到另一个系统，或将一个数据库的数据变化同步到另一个数据库，即进行数据同步。现有的数据同步的方法，如使用DataX进行数据同步时，往往存在单机内存不足、CPU处理性能不足以及网络吞吐能力不足等问题，从而无法有效应用于高吞吐、大并发的数据场景。因此，急需一种能实现分布式计算、高效稳定，适用于高吞吐、大并发的数据场景中的数据同步的方法。
技术实现思路
本专利技术的目的在于提供一种数据同步的方法，以解决现有技术中数据同步时网络吞吐能力不足的问题。为解决上述技术问题，本专利技术的实施方式公开了一种数据同步的方法，包括以下步骤：在Azkaban中封装自定义任务类型；配置数据的同步信息，同步信息包括原始数据源、数据名称、目标数据源；根据同步信息和自定义任务类型生成调度任务；执行调度任务完成数据同步。采用上述技术方案，可实现数据同步的分布式计算、高效稳定，适用于高吞吐、大并发的数据场景。可选地，自定义任务类型为Kubernetes任务，数据同步的方法还包括以下步骤：在Kubernetes中封装同步容器。可选地，执行调度任务完成数据同步的步骤，包括：调用Kubernetes，生成对应于调度任务的KubernetesJob...

【技术保护点】
1.一种数据同步的方法，其特征在于，包括以下步骤：/n在Azkaban中封装自定义任务类型；/n配置数据的同步信息，所述同步信息包括原始数据源、数据名称、目标数据源；/n根据所述同步信息和所述自定义任务类型生成调度任务；/n执行所述调度任务完成数据同步。/n

【技术特征摘要】
1.一种数据同步的方法，其特征在于，包括以下步骤：
在Azkaban中封装自定义任务类型；
配置数据的同步信息，所述同步信息包括原始数据源、数据名称、目标数据源；
根据所述同步信息和所述自定义任务类型生成调度任务；
执行所述调度任务完成数据同步。

2.如权利要求1所述的数据同步的方法，其特征在于，所述自定义任务类型为Kubernetes任务，所述数据同步的方法还包括以下步骤：
在Kubernetes中封装同步容器。

3.如权利要求2所述的数据同步的方法，其特征在于，所述执行所述调度任务完成数据同步的步骤，包括：
调用所述Kubernetes，生成对应于所述调度任务的KubernetesJob任务；
执行所述KubernetesJob任务完成数据同步。

4.如权利要求3所述的数据同步的方法，其特征在于，所述同步容器为DataX同步容器，所述执行所述KubernetesJob任务完成数据同步的步骤，包括：
根据所述同步信息获取原始数据表及对应于所述原始数据表的元信息；
根据所述原始数据表和所述元信息生成配置信息；
调用DataX读取所述配置信息完成数据同步。

5.如权利要求4所述的数据同步的方法，其特征在于，所述同步信息还包括限速信息。

6.如权利要求1所述的数据同步的方法，还包括以下步骤：
当所述调度任务执行失败时，重试所述调度任务。

7.一种数据同步的系统，其特征在于，包括：
配置模块，用于配置数据的同步信息，所述同步信息包括原始数...

【专利技术属性】
技术研发人员：郑永升，石磊，汤昭荣，
申请(专利权)人：杭州依图医疗技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人