一种基于kettle的动态数据库连接和自动化数据同步方法技术

技术编号：30370504 阅读：14 留言：0更新日期：2021-10-16 17:48

本发明专利技术公开一种基于kettle的动态数据库连接和自动化数据同步方法，涉及数据集成技术领域，包括步骤一、为kettle作业新建共享的DB连接信息，步骤二、设计元数据文件，描述数据分层后不同数据源环境与数据库连接信息映射关系，步骤三、数据传递，步骤四、使用Jenkins实现数据流程自动化，可实现使用kettle工具进行ETL数据同步过程中的数据库连接配置动态切换和整个ETL流程的自动化，具有操作简单、准确率高、速度快、可移植性强等特点。可移植性强等特点。可移植性强等特点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于kettle的动态数据库连接和自动化数据同步方法

[0001]本专利技术涉及数据集成
，具体涉及一种基于kettle的动态数据库连接和自动化数据同步方法。

技术介绍

[0002]Kettle是一种数据ETL工具，可以把数据从一个数据库系统同步到另外一个数据库系统中，本质上是数据清洗和迁移工具，但是缺乏动态数据库连接和自动化数据同步的手段。

技术实现思路

[0003]本专利技术的目的在于提供一种基于kettle的动态数据库连接和自动化数据同步方法，可实现使用kettle工具进行ETL数据同步过程中的数据库连接配置动态切换和整个ETL流程的自动化，具有操作简单、准确率高、速度快、可移植性强等特点。
[0004]一种基于kettle的动态数据库连接和自动化数据同步方法，包括如下步骤：
[0005]步骤一、为kettle作业新建共享的DB连接信息，
[0006]导入或打开kettle一个作业，在作业的菜单导航栏下，新建抽象的数据源层、数据中间层、数据目标层以及DB连接信息，输入数据库连接属性并使用变量定义，共享该DB连接信息；
[0007]步骤二、设计元数据文件，描述数据分层后不同数据源环境与数据库连接信息映射关系，
[0008]使用Json格式的数据描述数据层、应用环境、数据库连接实例信息之间的层级；
[0009]步骤三、数据传递，
[0010]根据元数据文件描述，将三个参数传递到Python程序，程序将这三个参数按照层级解析后，获取本次...

【技术保护点】

【技术特征摘要】
1.一种基于kettle的动态数据库连接和自动化数据同步方法，其特征在于，包括如下步骤：步骤一、为kettle作业新建共享的DB连接信息，导入或打开kettle一个作业，在作业的菜单导航栏下，新建抽象的数据源层、数据中间层、数据目标层以及DB连接信息，输入数据库连接属性并使用变量定义，共享该DB连接信息；步骤二、设计元数据文件，描述数据分层后不同数据源环境与数据库连接信息映射关系，使用Json格式的数据描述数据层、应用环境、数据库连接实例信息之间的层级；步骤三、数据传递，根据元数据文件描述，将三个参数传递到Python程序，程序将这三个参数按照层级解析后，获取本次ETL数据同步的数据源、数据中间层、数据目标层连信息后，生成连接属性KEY/VALUE并写入<user_home>/.kettle/kettle.properties配置文件，从而完成数据库连接信息的切换步骤；share.xml中定义的变量将根据KEY值从该文件中获取VALUE；步骤四、使用Jenkins实现数据流程自动化，建立ETL流程JenkinsPipeline，在Pipeline中建立GitcheckoutStage 1，SwitchEnvstage 2，Migration stage 3，在Jenkins中完成作业的数据源动态切换，数据源切换，自动化调度作业。2.根据权利要求1所述的一种基于kettle的动态数据库连接和自动化数据同步方法，其特征在于...

【专利技术属性】
技术研发人员：曹培，林永意，李淼淼，
申请(专利权)人：南京工业职业技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人