【技术实现步骤摘要】
一种自动化ETL数据处理工具及其使用方法
本专利技术涉及计算机
,尤其涉及一种自动化ETL数据处理工具及其使用方法。
技术介绍
随着大数据业务的快速发展,对数据进行ETL处理就变得非常的普遍。ETL处理的过程大致是将来自不同数据源中的数据抽取后进行清洗、转换、集成处理,即数据抽取、数据转换、数据加载等处理,并将处理后的数据置入目标数据仓库中。目前,存在多种不同类型的数据源,例如:关系型Mysql、非关系型HBase、数据仓库有Hive、文件存储HDFS、具有存储功能的文件索引服务Elasticsearch;而不同的数据类型的数据源可能会具有不同的接口类型。然而,针对不同的接口类型的数据源技术人员需要开发不同的ETL处理工具进行ETL处理,这样不仅增加了技术开发人员的工作量,而且开发效率也会偏低。鉴于现有技术中的缺点,如何提供一种使用简单、运行速度快、开发效率高的自动化ETL数据处理工具及其使用方法是本领域技术人员需要解决的技术难题。
技术实现思路
针对现有技术中的上述不足之处,本专利技术提供了一种自动化ETL数据处理工具及其使用方法。本专利技术为解决上述技术问题,采用以下技术方案来实现:设计一种自动化ETL数据处理工具,包括数据抽取模块、数据转换模块、任务创建模块、数据加载模块、数据存储模块和数据输出模块;所述的数据抽取模块与所述的数据转换模块连接,且所述的数据抽取模块用于获取数据源中的源数据,并将获取的源数据传递至所述的数据转换模块中;所述的数据转换模块与所述的任务创建模块连接,且所述的数据转换模块用于将接收到的源数据转换成CSV格式数据,并将所述的C ...
【技术保护点】
1.一种自动化ETL数据处理工具,其特征在于,包括数据抽取模块、数据转换模块、任务创建模块、数据加载模块、数据存储模块和数据输出模块;所述的数据抽取模块与所述的数据转换模块连接,且所述的数据抽取模块用于获取数据源中的源数据,并将获取的源数据传递至所述的数据转换模块中;所述的数据转换模块与所述的任务创建模块连接,且所述的数据转换模块用于将接收到的源数据转换成CSV格式数据,并将所述的CSV格式数据传递至任务创建模块中;所述的任务创建模块与所述的数据加载模块连接,且所述的任务创建模块用于依据所述的CSV格式数据来创建ETL任务;所述的数据加载模块与所述的数据输出模块连接,且所述的数据加载模块用于根据创建的ETL任务来执行、加载该ETL任务;所述的数据输出模块用于将ETL任务执行、加载以后的结果发送至目标数据仓库;所述的数据存储模块均与数据抽取模块、数据转换模块、任务创建模块以及数据加载模块连接,其用于存储输入数据、中间数据以及ETL任务执行以后的结果。
【技术特征摘要】
1.一种自动化ETL数据处理工具,其特征在于,包括数据抽取模块、数据转换模块、任务创建模块、数据加载模块、数据存储模块和数据输出模块;所述的数据抽取模块与所述的数据转换模块连接,且所述的数据抽取模块用于获取数据源中的源数据,并将获取的源数据传递至所述的数据转换模块中;所述的数据转换模块与所述的任务创建模块连接,且所述的数据转换模块用于将接收到的源数据转换成CSV格式数据,并将所述的CSV格式数据传递至任务创建模块中;所述的任务创建模块与所述的数据加载模块连接,且所述的任务创建模块用于依据所述的CSV格式数据来创建ETL任务;所述的数据加载模块与所述的数据输出模块连接,且所述的数据加载模块用于根据创建的ETL任务来执行、加载该ETL任务;所述的数据输出模块用于将ETL任务执行、加载以后的结果发送至目标数据仓库;所述的数据存储模块均与数据抽取模块、数据转换模块、任务创建模...
【专利技术属性】
技术研发人员:赵明,
申请(专利权)人:安徽三实软件科技有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。