【技术实现步骤摘要】
一种基于流处理和消息队列的数据处理平台
[0001]本专利技术涉及数据处理
,尤其涉及一种基于流处理和消息队列的数据处理平台
。
技术介绍
[0002]目前,传统意义上的数据仓库主要处理
T+1
数据
(
即:今天产生的数据分析结果明天才能看到
)。
[0003]然而,随着互联网的发展,越来越多的业务指标需要实时查看,以便于更好的进行业务分析,例如,在举行活动的时候,若能够更好的把握活动的各项指标趋势,可以更好的调整策略,达成活动目标
。
此外,数据时效性在企业运营中的重要性也日益凸现,例如,实时推荐
、
精准营销
、
广告投放效果
、
实时物流等
。
数据的实时处理能力成为企业提升竞争力的一大因素,最初阶段企业主要采用来一个需求,编写一个实时计算任务的方式来处理实时数据,随着需求的增多,计算任务也相应增多,并且不同任务的开发人员不同,导致开发风格差异化,该阶段的实时数据处理缺乏统一的规划,代码风格差异化严重,在维护成本和开发效率上有很大障碍
。
技术实现思路
[0004]本专利技术提供了一种基于流处理和消息队列的数据处理平台,以解决现有技术中的数据处理平台实时性差
、
维护成本高和开发效率低的问题
。
[0005]本专利技术提供的基于流处理和消息队列的数据处理平台,包括:实时数据采集模块
、
实时数仓模块 ...
【技术保护点】
【技术特征摘要】
1.
一种基于流处理和消息队列的数据处理平台,其特征在于,所述平台包括实时数据采集模块
、
实时数仓模块和实时指标访问模块;所述实时数据采集模块,部署有流式数据传输工具,用于实时采集指定数据库的实时数据,并将所述实时数据发送给消息队列;所述实时数仓模块,用于抽取消息队列中的实时数据,并进行转换和加载的流处理操作,形成宽表存储于构建的实时数仓;所述实时指标访问模块,用于访问实时数仓中的数据以进行开发或展示
。2.
如权利要求1所述的基于流处理和消息队列的数据处理平台,其特征在于,所述流式数据传输工具包括卡夫卡连接器,所述消息队列包括卡夫卡消息队列
。3.
如权利要求2所述的基于流处理的数据处理平台,其特征在于,所述卡夫卡连接器在挂掉重启后,从起始消费的系统改变号开始消费
。4.
如权利要求3所述的基于流处理和消息队列的数据处理平台,其特征在于,所述实时数据包括企业业务系统数据库的
binlog
日志与归档日志,和
/
或,企业应用系统数据库的日志文件;其中,企业业务系统数据库端注册有分布式服务工具
Debezium
,用于将
binlog
日志与归档日志转换为事件流提供给卡夫卡连接器;企业应用系统数据库注册有
Filebeat
工具,用于集中企业应用系统数据库的日志文件并转发给卡夫卡连接器
。5.
如权利要求1至4任一项所述的基于流处理和消息队列的数据处理平台,其特征在于,所述实时数仓模块包括:数据贴源层,用于构建数据准备区,接入实时数据采集模块发送的实时数据,并针对实时数据对应的每个数据表创建一个消息集合;数据明细层,作为业务层...
【专利技术属性】
技术研发人员:李庆安,
申请(专利权)人:深圳联友科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。