【技术实现步骤摘要】
一种基于Kettle的大数据汇聚集成方法
[0001]本专利技术属于大数据处理
,涉及一种基于Kettle的大数据汇聚集成方法。
技术介绍
[0002]随着企业信息化应用的不断深入,在寻求业务管理精益的同时,信息化对于决策的支撑、对于市场前沿的洞察力成为了越来越多企业深化应用的方向。当前企业信息系统的数据量越来越多,种类越来越丰富,但是总体来说,数据相互独立,内在逻辑互不联系,信息孤岛问题严重,迫切需要对数据进行汇聚、集成、整合和分析。数据整合分析已成为现代企业管理的通用性需求。
技术实现思路
[0003]本专利技术的目的是提供一种大数据汇聚集成方法,采用简单直观的数据管理视图,针对百亿级规模的结构化、半结构化、非结构化数据,提供可适配的统一接入模式,提供数据资源管理、任务调度管理、任务监控管理、集群配置管理、分布式文件存储、文件解析等多项功能。
[0004]本专利技术的技术方案如下:
[0005]一种基于Kettle的大数据汇聚集成方法,其特征在于包括以下步骤:
[0006]( ...
【技术保护点】
【技术特征摘要】
1.一种基于Kettle的大数据汇聚集成方法,其特征在于包括以下步骤:(1)数据资源管理:对数据资源的各类信息进行配置和管理,实现各数据库与ETL工具的连接与联动;(2)Kettle流程设计器:通过对kettle各核心组件的封装与二次开发,实现复杂流程的设计并生成任务,同时,创新使用集群抽取方式,实现高效数据集成;(3)任...
【专利技术属性】
技术研发人员:张丹普,
申请(专利权)人:北京航天长峰科技工业集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。