The invention discloses a real-time flow calculation monitoring system and method for processing large monitoring data. The system includes a data acquisition unit, which uses a monitoring agent to obtain the original monitoring data on the corresponding machine by means of active reporting or active collection, and a data buffer unit, which includes the monitoring original data collected by the monitoring agent and the monitoring data stored after aggregated calculation. High performance message queue Kafka; data computing unit, based on high concurrent flow computing engine Flink, aggregates the original monitoring data, and the aggregated monitoring data is sent to high performance message queue Kafka for temporary cache; monitoring state management service unit, which monitors the running status of data acquisition unit and data computing unit; data storage unit and number According to the display unit, the system and method disclosed by the invention ensures the accuracy of high concurrent calculation and speeds up the display speed.
【技术实现步骤摘要】
一种处理监控大数据的实时流计算监控系统及方法
本专利技术涉及大数据计算
,特别涉及一种处理监控大数据的实时流计算监控系统及方法。
技术介绍
随着云计算大数据技术的日益普及,分布式技术快速发展,业务系统规模日益复杂,机器规模日益庞大,相应产生的监控数据也逐渐成为一种大数据(以下简称“监控大数据”),传统的监控系统在应对监控大数据时显得力不从心,因此迫切需要新的监控系统具有高并发的处理能力。众所周知,数据价值随着时间的流逝而快速降低,监控大数据对时间的要求更加迫切,如果监控到故障数据后,系统很久才能做出处理,那么系统的可用性及可靠性将大打折扣,因此迫切需要新的监控系统具有实时流计算的处理能力。监控大数据是一种典型的时间序列数据(以下简称“时序数据”),这是一种以(时间戳,数值)为元组的数据类型,需要特殊数据库存储,而传统的监控系统都是使用关系型数据库存储监控数据,因此迫切需要新的监控系统使用时序数据库存储监控大数据。监控大数据的展现是监控系统非常重要的一部分,传统的监控系统展现能力比较弱,直接展示原始监控数据时性能比较差,随着前端技术的发展,对监控大数据展现能力的要求也越来越高,因此迫切需要新的监控系统具有很强的前端展现能力。监控大数据一般涉及到三个时间:监控数据产生的事件时间(EventTime),监控数据到达监控系统的时间(IngestionTime),监控数据被处理的时间(ProcessTime),传统的监控系统只能按照处理时间(ProcessTime)处理监控数据,当有网络延迟时,错误率比较高,因此迫切需要新的监控系统具有同时处理以上三种时间的能 ...
【技术保护点】
1.一种处理监控大数据的实时流计算监控系统,其特征在于,包括如下单元:数据采集单元,采用监控Agent,通过主动上报或主动收集的方式获得对应机器上的监控原始数据;数据缓存单元,包括用于存储监控Agent收集到的监控原始数据和存储聚合计算后的监控数据的高性能消息队列Kafka;数据计算单元,基于高并发流计算引擎Flink,对原始监控数据进行聚合计算,同时对监控数据划分时间窗口,在每个计算窗口内,按照监控指标进行分组,根据监控数据自身携带的数据采集时间进行聚合计算,处理乱序数据以及延迟到达数据,聚合计算完的监控数据被发送到高性能消息队列Kafka中做暂时缓存;监控状态管理服务单元,用于监控数据采集单元和数据计算单元的运行状态;数据存储单元,包括用于存储聚合计算后的监控数据的时序数据库InfluxDB,和用于存储监控原始数据的HBase;数据展现单元,通过Grafana展现进行聚合计算后的监控数据,并且通过钻取功能,从HBase中联查到原始的监控数据。
【技术特征摘要】
1.一种处理监控大数据的实时流计算监控系统,其特征在于,包括如下单元:数据采集单元,采用监控Agent,通过主动上报或主动收集的方式获得对应机器上的监控原始数据;数据缓存单元,包括用于存储监控Agent收集到的监控原始数据和存储聚合计算后的监控数据的高性能消息队列Kafka;数据计算单元,基于高并发流计算引擎Flink,对原始监控数据进行聚合计算,同时对监控数据划分时间窗口,在每个计算窗口内,按照监控指标进行分组,根据监控数据自身携带的数据采集时间进行聚合计算,处理乱序数据以及延迟到达数据,聚合计算完的监控数据被发送到高性能消息队列Kafka中做暂时缓存;监控状态管理服务单元,用于监控数据采集单元和数据计算单元的运行状态;数据存储单元,包括用于存储聚合计算后的监控数据的时序数据库InfluxDB,和用于存储监控原始数据的HBase;数据展现单元,通过Grafana展现进行聚合计算后的监控数据,并且通过钻取功能,从HBase中联查到原始的监控数据。2.一种处理监控大数据的实时流计算监控方法,采用如权利要求1所述的一种处理监控大数据的实时流计算监控系统,其特征在于,包括如下步骤:(1)数据采集:数据采集单元利用监控Agent,通过主动上报或主动收集的方式获得对应机器上的监控原始数据,并且定时调用监控状态管理服务单元,实现对监控Agent状态的实时自监控;(2)数据缓存:监控Agent收集到监控原始数据后,在本地做短时间的内存缓存,然后批量将监控原始数据发送到高性能消息队列Kafka,作为所有分布式监控大数据的集中数据缓存;(3)数据计算:通过高并发流计算引擎Flink,从高性能消息队列Kafka中实时拉取...
【专利技术属性】
技术研发人员:刘桂海,陈忠强,黄伟,鞠强,魏亮,周国庆,
申请(专利权)人:青岛特锐德电气股份有限公司,青岛特来电新能源有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。