【技术实现步骤摘要】
集群数据监控方法、装置、存储介质和电子设备
[0001]本专利技术涉及计算机领域,具体而言,涉及一种集群数据监控方法、装置、存储介质和电子设备。
技术介绍
[0002]现有技术中,在服务器中经常使用各种的组件来提供服务。而提供的组件由于种类和来源等均不相同,以及组件提供的服务也不相同,因此,无法对集群中的组件、服务以及集群等数据进行准确的监控以及告警。
技术实现思路
[0003]本专利技术实施例提供了一种集群数据监控方法、装置、存储介质和电子设备,以至少解决集群数据监控告警效率低的技术问题。
[0004]根据本专利技术实施例的一个方面,提供了一种集群数据监控方法,包括:获取每一个集群中每一个组件的指标数据,其中,每一个所述集群中包括多个组件,每一个组件对应一个所述指标数据;对每一个所述集群中的所述指标数据按照服务维度与集群维度进行聚合,得到每一个所述集群的集群数据与每一个所述集群中每一个服务的服务数据;根据每一个所述集群中的所述指标数据对每一个所述集群中的每一个所述组件进行监控,以及根据每一个所述集群 ...
【技术保护点】
【技术特征摘要】
1.一种集群数据监控方法,其特征在于,包括:获取每一个集群中每一个组件的指标数据,其中,每一个所述集群中包括多个组件,每一个组件对应一个所述指标数据;对每一个所述集群中的所述指标数据按照服务维度与集群维度进行聚合,得到每一个所述集群的集群数据与每一个所述集群中每一个服务的服务数据;根据每一个所述集群中的所述指标数据对每一个所述集群中的每一个所述组件进行监控,以及根据每一个所述集群中的所述服务数据对每一个所述集群中的每一个所述服务进行监控,以及根据每一个所述集群的所述集群数据对每一个所述集群进行监控。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:将每一个集群作为当前集群,注册当前集群所有的组件的组件进程;每隔第一时长对所述组件进程进行检测;在获取目标组件的目标指标数据失败的情况下,在所述目标组件的目标进程不存在的情况下,上报所述目标进程不存在。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:每隔第二时长对所述组件进程对应的组件服务端口进行检测;在获取所述目标组件的目标指标数据失败的情况下,在所述目标组件的目标进程存在的情况下,在所述目标组件对应的目标组件服务端口不可用的情况下,上报所述目标组件服务端口不可用。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:在所述目标组件的目标进程存在的情况下,在所述目标组件对应的目标组件服务端口可用的情况下,上报所述目标组件存在特殊异常。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:由每一个所述集群中的监控脚本监控每一个所述集群中的每一个主机的主机参数指标;在所述主机参数指标超出正常数据范围的情况下,确定对应的所述主机存在异常。6.根据权利要求1至5任意一项所述的方法,其特征在于,所述获取采集模块采集的集群中每一个组件的指标数据包括:调用管理扩展工具JMX采集每一个所述组件的CPU使用率、进程存活状态、读写速率、写读延迟以及负载。7.根据权利要求1...
【专利技术属性】
技术研发人员:赵宇,王东,侯雪峰,
申请(专利权)人:北京金山云网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。