【技术实现步骤摘要】
一种基于数据库二进制日志文件的数据实时汇聚方法
[0001]本专利技术涉及一种数据实时汇聚方法,尤其涉及一种基于数据库二进制日志文件的数据实时汇聚方法
。
技术介绍
[0002]随着移动互联网
、
云计算
、
物联网的快速发展,数据的指数级增长以及各企事业单位对数据的重视程度提高,致使各企事业单位对源端数据库数据实时汇聚需求越来越迫切,而现有的技术多为单一的数据库汇聚或离线汇聚,无法满足用户需求
。
现有的基于数据库的汇聚方法,有几大缺点:一
、
支持的类型单一
。
如开源工具
Maxwell
仅支持通过
MySQL
的
Binlog
文件进行源端
MySQL
数据的实时汇聚,无法支持其他数据类型;二
、
无法实时汇聚
。
如开源工具
Canal
仅支持数据库数据的离线汇聚,无法进行实时汇聚
。
技术实现思路
[0003]为了解决上述技术所存在的不足之处,本专利技术提供了一种基于数据库二进制日志文件的数据实时汇聚方法
。
[0004]为了解决以上技术问题,本专利技术采用的技术方案是:一种基于数据库二进制日志文件的数据实时汇聚方法,包括:步骤
S1
:从支持的源端数据类型和支持的目的端数据类型中分别选择要作为实时汇聚的数据源;步骤
S2
:完成选择后, ...
【技术保护点】
【技术特征摘要】
1.
一种基于数据库二进制日志文件的数据实时汇聚方法,其特征在于,包括以下步骤:步骤
S1
:从支持的源端数据类型和支持的目的端数据类型中分别选择要作为实时汇聚的数据源;步骤
S2
:完成选择后,配置源端数据源和目的端数据源之间的映射关系和汇聚规则;步骤
S3
:配置与实时汇聚任务相关的调度参数;步骤
S4
:将步骤
S1
至
S3
中选择和配置的信息均加载到任务实例中;步骤
S5
:利用任务执行器拉取任务实例,并执行实时汇聚任务
。2.
根据权利要求1所述的基于数据库二进制日志文件的数据实时汇聚方法,其特征在于:所述步骤
S1
中利用数据库二进制日志文件的变更数据捕获能力,从而支持多种类型的数据源
。3.
根据权利要求1所述的基于数据库二进制日志文件的数据实时汇聚方法,其特征在于:所述步骤
S2
中的汇聚规则包括聚合规则
、
过滤规则
、
裁剪规则;聚合规则是以
Lambda
方式对单张表进行数据聚合设定;过滤规则首先选择要保留的列字段信息,其次选择过滤函数,针对需保留列字段信息的所在列进行指定条件过滤;裁剪规则是指保留要输出到目的端的属性列
。4.
根据权利要求3所述的基于数据库二进制日志文件的数据实时汇聚方法,其特征在于:所述聚合规则仅支持单表操作;当实时汇聚多个表时,通过使用裁剪规则或过滤规则来生成汇聚任务
。5.
根据权利要求1所述的基于数据库二进制日志文件的数据实时汇聚方法,其特征在于:所述步骤
S5
中各任务会根据自身的优先级放置于任务队列中,空闲...
【专利技术属性】
技术研发人员:匙会,庞景秋,齐井春,李绍俊,李波,孙纪福,战炳良,
申请(专利权)人:长春嘉诚信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。