用于数据转换、数据迁移的方法和装置制造方法及图纸

技术编号：12888640 阅读：63 留言：0更新日期：2016-02-17 22:41

本申请公开了一种用于数据转换的方法和装置、以及一种用于数据迁移的方法和装置。其中所述用于数据转换的方法包括：从预先生成的配置文件中读取采用领域专用语言描述的数据转换规则，所述数据转换规则，用于指定根据待转换数据生成目标数据所需执行的转换操作；解析所述数据转换规则，生成与所述数据转换规则对应的数据转换算法；读取待转换数据，并根据所述数据转换算法对所述待转换数据进行转换。采用本申请提供的方法，实现了数据转换代码的复用，有效减少开发人员的工作量；而且由于采用了领域特定语言进行数据转换规则的描述，简单易懂，学习成本低，即使是执行数据转换操作的普通用户也可以胜任对配置文件中的数据转换规则的配置或修改工作。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理技术，具体提供一种用于数据转换的方法和装置。本申请同时提供一种用于数据迁移的方法和装置。
技术介绍
随着互联网的发展，社交数据、在线交易记录、社交媒体等数据日益增多，大量企业开始拥有海量的客户信息，不仅需要计算机存储和处理的数据数量成指数级增长，而且数据类型也越来越复杂。这些数据通常存储在各种数据源中，有的存储在传统的关系型数据库中，例如：mySQL、oracle等数据库系统；有的存储在近年来蓬勃发展的NoSQL数据库中，例如：HBase、Redis等数据库系统；有的则存储在文件系统中，例如：分布式系统集群 Hadoop的分布式文件系统HDFS(Hadoop Distributed File System，HDFS)中。由于系统备份、升级、数据交换或者数据共享等需求，有时需要在上述各种数据源之间进行数据迁移，即：从作为源端的数据源中导出数据，并将导出的数据导入到作为目的端的数据源中。由于各种数据源的数据模型不同，例如，关系型数据库与NoSQL数据库的数据组织方式不同，或者虽然两个数据源都属于关系型数据库，但是数据表的结构不同，都会导致在上述导出、导入的过程中需要进行数据转换操作，将从源端读取的数据转换为符合目的端数据模型的数据。现有技术中针对数据导入导出过程中的数据转换需求，通常有两种解决方案。一种是case by case的，即针对每一次的数据迁移需求，根据具体的数据源端和数据目的端的数据模型，编写代码实现数据的导出、转换和导入操作；另一种是采用DataX工具进行迁移，即采用DataX提供的从...

【技术保护点】
一种用于数据转换的方法，其特征在于，包括：从预先生成的配置文件中读取采用领域专用语言描述的数据转换规则，所述数据转换规则，用于指定根据待转换数据生成目标数据所需执行的转换操作；解析所述数据转换规则，生成与所述数据转换规则对应的数据转换算法；读取待转换数据，并根据所述数据转换算法对所述待转换数据进行转换。

【技术特征摘要】

【专利技术属性】
技术研发人员：史策，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人