【技术实现步骤摘要】
数据采集方法、装置、电子设备及存储介质
[0001]本专利技术涉及数据处理领域,尤其涉及一种数据采集方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着大数据的日益发展,数据采集成为一个必不可少的流程,目前大数据的数据采集通常是基于nginx+flume+kafka等组件实现,其中,nginx组件用于接收用户行为日志反向代理写入磁盘里去,flume组件直接从磁盘目录里读取Nginx组件不断写入的日志,以写入kafka组件中,但是在nginx到数据采集层flume,及flume到kafka存储层容易存在数据丢失的情况,从而导致数据采集的不够完整。
技术实现思路
[0003]本专利技术提供一种数据采集方法、装置、电子设备及计算机可读存储介质,其主要目的在于实现数据采集的零丢失,保障数据采集的完整性。
[0004]为实现上述目的,本专利技术提供的一种数据采集方法,包括:
[0005]识别数据采集需求的数据类别,所述数据类别包括行为数据和业务数据;
[0006]在所述数据类别 ...
【技术保护点】
【技术特征摘要】
1.一种数据采集方法,其特征在于,所述方法包括:识别数据采集需求的数据类别,所述数据类别包括行为数据和业务数据;在所述数据类别为业务数据时,从业务数据库中获取待采集数据,并采用主备复制的方式将所述业务数据库中的待采集数据加载至数据同步组件中,基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中;在所述数据类别为行为数据时,从前端页面中获取待采集数据,采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,并将所述数据采集层中的数据存入缓存队列中;将所述缓存队列中的数据加载至所述日志采集系统的分发层中,并基于所述预构建的容错机制将所述分发层中的数据存储至所述消息中间件中。2.如权利要求1所述的数据采集方法,其特征在于,所述采用主备复制的方式将所述业务数据库中待采集数据加载至数据同步组件中,包括:配置所述数据同步组件的主采集节点和备采集节点;利用所述主采集节点向所述业务数据库中采集所述待采集数据,实时监控所述主采集节点向所述业务数据库进行数据采集是否出现异常;若所述主采集节点未出现异常,继续所述待采集数据的采集,并将采集的数据传输至所述数据同步组件中;若所述主采集节点出现异常,切换所述备采集节点采集所述待采集数据,并将采集的数据传输至所述数据同步组件中。3.如权利要求2所述的数据采集方法,其特征在于,所述利用所述主采集节点向所述业务数据库中采集所述待采集数据,包括:在所述业务数据库配置所述主采集节点的日志文件,基于所述日志文件从所述业务数据库中读取所述待采集数据。4.如权利要求1所述的数据采集方法,其特征在于,所述基于预构建的容错机制将所述数据同步组件中的数据存储至消息中间件中,包括:实时监控所述数据同步组件的数据在存储过程中所述消息中间件是否出现异常;若所述消息中间件出现异常,则将所述数据同步组件的数据暂存至本地磁盘中,直至所述消息中间件恢复异常后将所述本地磁盘的数据上传至所述消息中间件中;若所述消息中间件未出现异常,则继续执行所述数据同步组件中的数据存储。5.如权利要求1所述的数据采集方法,其特征在于,所述采用故障转移的方式将所述前端页面中的待采集数据加载至日志采集系统的数据采集层中,包括:采用反向代理的方式将所述前端页面中的待采集数据分发至预...
【专利技术属性】
技术研发人员:李志敏,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。