【技术实现步骤摘要】
一种基于分布式架构的大数据采集平台系统
[0001]本专利技术涉及计算机
,特别是一种基于分布式架构的大数据采集平台系统
。
技术介绍
[0002]大数据开发过程中,除了需要采集关系型数据库的数据,还可能需要采集日志数据
、
传输报文数据,实际使用场景中产生如下问题:需要一个能够提供高速
、
可靠的数据流通道服务;在数据采集的过程中往往需要对数据发送端进行身份认证,以及有效时长的限制,需要有同一的认证配置中心;需要能够提供订阅的功能,将数据主动推送给数据使用者,且该功能需要稳定可靠
、
高效;由于数据采集
/
分发服务需要持续对外提供服务,那么对数据采集
/
分发服务也要求具备稳定可靠
、
高效的特点;需要能够简单高效的进行服务的安装部署,日志查阅,数据流监控等,而不是手动部署,登录服务器查阅运行日志,流量监控等;需要简单高效的对消息队列进行设置使用以及监控,观察监控数据流
。
[0003]因此在
Flume
的基础上,开发出一个数据采集平台,来解决实际使用中的一系列问题,让数据开发人员真正能够快速通过配置的方式,完成所有的大数据开发,提高开发效率
。
技术实现思路
[0004]本专利技术的目的在于提供一种基于分布式架构的大数据采集平台系统,包括客户端采集服务及客户端
SDK
包
、
数据交换服务
、
数据 ...
【技术保护点】
【技术特征摘要】
1.
一种基于分布式架构的大数据采集平台系统,其特征在于:包括客户端采集服务及客户端
SDK
包
、
数据交换服务
、
数据分发服务
、
监控服务和
Web
服务五个模块;其中,客户端采集服务及客户端
SDK
包提供数据采集
、
数据缓存
、
数据发送
、Metric
指标监控等功能,用户将客户端采集服务部署在需要的服务器上,通过配置采集指定的数据文件,数据将发往数据交换服务上,或者用户使用
SDK
包,通过调用
API
的方式将数据发送到数据交换服务上;其中,数据交换服务提供身份验证
、
数据接收
、
高可用方案功能,对于客户端采集服务或客户端
SDK
包发送过来的数据进行身份认证,有效保护数据的安全性,验证通过后,将数据发往指定的消息队列中,供下游数据使用;其中,数据分发服务提供数据分发
、Metrics
指标监控,通过数据分发服务,方便用户进行消息的订阅,数据分发服务将从消息队列中获取用户需要的数据,并主动推动给用户;其中,监控服务提供状态监控
、
进程启停
、
日志操作功能,对后台服务进行有效监控,包括进程启停
、
日志查阅
、
状态监控等;其中,
Web
服务提供监控信息展示
、
进程启停可视化操作
、
认证信息生成
、
消息队列的创建功能,通过
Web...
【专利技术属性】
技术研发人员:邵健锋,朱国全,方友仓,洪森权,
申请(专利权)人:深圳市今天国际物流技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。