一种基于Kettle的大数据汇聚集成方法技术

技术编号:37333011 阅读:41 留言:0更新日期:2023-04-21 23:11
本发明专利技术涉及一种基于Kettle的大数据汇聚集成方法,包括:数据资源管理,对数据资源的各类信息进行配置和管理,实现各数据库与ETL工具的连接与联动;Kettle流程设计器,通过对kettle各核心组件的封装与二次开发,实现高效数据集成;任务调度管理,提供调度规则的配置和任务的管理;任务监控管理,提供任务执行状态的监控和管理;集群配置管理,对Kettle集群的配置信息进行管理;分布式文件存储,对文件资源进行存储和管理,实现高效的文件存储;文件解析,对文件资源进行高效的解析入库。本发明专利技术可提供基于分布式并行架构开发的ETL数据集成功能,具备高吞吐、高可用、高扩展特性。高扩展特性。

【技术实现步骤摘要】
一种基于Kettle的大数据汇聚集成方法


[0001]本专利技术属于大数据处理
,涉及一种基于Kettle的大数据汇聚集成方法。

技术介绍

[0002]随着企业信息化应用的不断深入,在寻求业务管理精益的同时,信息化对于决策的支撑、对于市场前沿的洞察力成为了越来越多企业深化应用的方向。当前企业信息系统的数据量越来越多,种类越来越丰富,但是总体来说,数据相互独立,内在逻辑互不联系,信息孤岛问题严重,迫切需要对数据进行汇聚、集成、整合和分析。数据整合分析已成为现代企业管理的通用性需求。

技术实现思路

[0003]本专利技术的目的是提供一种大数据汇聚集成方法,采用简单直观的数据管理视图,针对百亿级规模的结构化、半结构化、非结构化数据,提供可适配的统一接入模式,提供数据资源管理、任务调度管理、任务监控管理、集群配置管理、分布式文件存储、文件解析等多项功能。
[0004]本专利技术的技术方案如下:
[0005]一种基于Kettle的大数据汇聚集成方法,其特征在于包括以下步骤:
[0006](1)数据资源管理:对本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于Kettle的大数据汇聚集成方法,其特征在于包括以下步骤:(1)数据资源管理:对数据资源的各类信息进行配置和管理,实现各数据库与ETL工具的连接与联动;(2)Kettle流程设计器:通过对kettle各核心组件的封装与二次开发,实现复杂流程的设计并生成任务,同时,创新使用集群抽取方式,实现高效数据集成;(3)任...

【专利技术属性】
技术研发人员:张丹普
申请(专利权)人:北京航天长峰科技工业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1