集群数据监控方法、装置、存储介质和电子设备制造方法及图纸

技术编号:33132003 阅读:11 留言:0更新日期:2022-04-17 00:50
本发明专利技术公开了一种集群数据监控方法、装置、存储介质和电子设备。该方法包括:获取每一个集群中每一个组件的指标数据,其中,每一个集群中包括多个组件,每一个组件对应一个指标数据;对每一个集群中的指标数据按照服务维度与集群维度进行聚合,得到每一个集群的集群数据与每一个集群中每一个服务的服务数据;根据每一个集群中的指标数据对每一个集群中的每一个组件进行监控,以及根据每一个集群中的服务数据对每一个集群中的每一个服务进行监控,以及根据每一个集群的集群数据对每一个集群进行监控。本发明专利技术解决了集群数据监控告警效率低的技术问题。低的技术问题。低的技术问题。

【技术实现步骤摘要】
集群数据监控方法、装置、存储介质和电子设备


[0001]本专利技术涉及计算机领域,具体而言,涉及一种集群数据监控方法、装置、存储介质和电子设备。

技术介绍

[0002]现有技术中,在服务器中经常使用各种的组件来提供服务。而提供的组件由于种类和来源等均不相同,以及组件提供的服务也不相同,因此,无法对集群中的组件、服务以及集群等数据进行准确的监控以及告警。

技术实现思路

[0003]本专利技术实施例提供了一种集群数据监控方法、装置、存储介质和电子设备,以至少解决集群数据监控告警效率低的技术问题。
[0004]根据本专利技术实施例的一个方面,提供了一种集群数据监控方法,包括:获取每一个集群中每一个组件的指标数据,其中,每一个所述集群中包括多个组件,每一个组件对应一个所述指标数据;对每一个所述集群中的所述指标数据按照服务维度与集群维度进行聚合,得到每一个所述集群的集群数据与每一个所述集群中每一个服务的服务数据;根据每一个所述集群中的所述指标数据对每一个所述集群中的每一个所述组件进行监控,以及根据每一个所述集群中的所述服务数据对每一个所述集群中的每一个所述服务进行监控,以及根据每一个所述集群的所述集群数据对每一个所述集群进行监控。
[0005]根据本专利技术实施例的另一方面,提供了一种集群数据监控装置,包括:获取模块,用于获取每一个集群中每一个组件的指标数据,其中,每一个所述集群中包括多个组件,每一个组件对应一个所述指标数据;聚合模块,用于对每一个所述集群中的所述指标数据按照服务维度与集群维度进行聚合,得到每一个所述集群的集群数据与每一个所述集群中每一个服务的服务数据;第一监控模块,用于根据每一个所述集群中的所述指标数据对每一个所述集群中的每一个所述组件进行监控,以及根据每一个所述集群中的所述服务数据对每一个所述集群中的每一个所述服务进行监控,以及根据每一个所述集群的所述集群数据对每一个所述集群进行监控。
[0006]作为一种可选的示例,所述装置还包括:注册模块,用于将每一个集群作为当前集群,注册当前集群所有的组件的组件进程;第一检测模块,用于每隔第一时长对所述组件进程进行检测;第一上报模块,用于在获取目标组件的目标指标数据失败的情况下,在所述目标组件的目标进程不存在的情况下,上报所述目标进程不存在。
[0007]作为一种可选的示例,所述装置还包括:第二检测模块,用于每隔第二时长对所述组件进程对应的组件服务端口进行检测;第二上报模块,用于在获取所述目标组件的目标指标数据失败的情况下,在所述目标组件的目标进程存在的情况下,在所述目标组件对应的目标组件服务端口不可用的情况下,上报所述目标组件服务端口不可用。
[0008]作为一种可选的示例,所述装置还包括:第三上报模块,用于在所述目标组件的目
标进程存在的情况下,在所述目标组件对应的目标组件服务端口可用的情况下,上报所述目标组件存在特殊异常。
[0009]作为一种可选的示例,所述装置还包括:第二监控模块,用于由每一个所述集群中的监控脚本监控每一个所述集群中的每一个主机的主机参数指标;确定模块,用于在所述主机参数指标超出正常数据范围的情况下,确定对应的所述主机存在异常。
[0010]作为一种可选的示例,所述获取模块包括:调用单元,用于调用管理扩展工具JMX采集每一个所述组件的CPU使用率、进程存活状态、读写速率、写读延迟以及负载。
[0011]作为一种可选的示例,所述第一监控模块包括:第一确定单元,用于在任意一个第一组件的所述指标数据超出正常范围的情况下,确定所述第一组件异常;第二确定单元,用于在任意一个第一服务的所述服务数据超出正常范围的情况下,确定所述第一服务异常;第三确定单元,用于在任意一个第一集群的所述集群数据超出正常范围的情况下,确定所述第一集群异常。
[0012]作为一种可选的示例,所述装置还包括:提示模块,用于在任意一个所述集群异常或者任意一个所述服务异常或者任意一个所述组件异常的情况下,向目标号码发送监控短信,或者向所述目标号码拨号,或者向目标账号发送监控邮件,以提示所述集群或所述服务或所述组件存在异常。
[0013]根据本专利技术实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述集群数据监控方法。
[0014]根据本专利技术实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过上述计算机程序执行上述的集群数据监控方法。
[0015]在本专利技术实施例中,采用了获取每一个集群中每一个组件的指标数据,其中,每一个所述集群中包括多个组件,每一个组件对应一个所述指标数据;对每一个所述集群中的所述指标数据按照服务维度与集群维度进行聚合,得到每一个所述集群的集群数据与每一个所述集群中每一个服务的服务数据;根据每一个所述集群中的所述指标数据对每一个所述集群中的每一个所述组件进行监控,以及根据每一个所述集群中的所述服务数据对每一个所述集群中的每一个所述服务进行监控,以及根据每一个所述集群的所述集群数据对每一个所述集群进行监控的方法,由于在上述方法中,可以获取到每一个集群中每一个组件的指标数据,然后对组件的数据按照服务维度与集群维度进行聚合,聚合后根据指标数据、服务数据与集群数据分别对每一个组件、每一个服务与集群进行监控,从而实现了准确对不同来源或类型的组件进行监控告警以及对服务和集群进行监控告警的目的,进而解决了集群数据监控告警效率低的技术问题。
附图说明
[0016]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0017]图1是根据本专利技术实施例的一种可选的集群数据监控方法的流程图;
[0018]图2是根据本专利技术实施例的一种可选的集群数据监控方法的系统示意图;
[0019]图3是根据本专利技术实施例的一种可选的集群数据监控方法的监控告警示意图;
[0020]图4是根据本专利技术实施例的一种可选的集群数据监控方法的获取指标数据示意图;
[0021]图5是根据本专利技术实施例的一种可选的集群数据监控装置的结构示意图。
具体实施方式
[0022]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0023]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种集群数据监控方法,其特征在于,包括:获取每一个集群中每一个组件的指标数据,其中,每一个所述集群中包括多个组件,每一个组件对应一个所述指标数据;对每一个所述集群中的所述指标数据按照服务维度与集群维度进行聚合,得到每一个所述集群的集群数据与每一个所述集群中每一个服务的服务数据;根据每一个所述集群中的所述指标数据对每一个所述集群中的每一个所述组件进行监控,以及根据每一个所述集群中的所述服务数据对每一个所述集群中的每一个所述服务进行监控,以及根据每一个所述集群的所述集群数据对每一个所述集群进行监控。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:将每一个集群作为当前集群,注册当前集群所有的组件的组件进程;每隔第一时长对所述组件进程进行检测;在获取目标组件的目标指标数据失败的情况下,在所述目标组件的目标进程不存在的情况下,上报所述目标进程不存在。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:每隔第二时长对所述组件进程对应的组件服务端口进行检测;在获取所述目标组件的目标指标数据失败的情况下,在所述目标组件的目标进程存在的情况下,在所述目标组件对应的目标组件服务端口不可用的情况下,上报所述目标组件服务端口不可用。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:在所述目标组件的目标进程存在的情况下,在所述目标组件对应的目标组件服务端口可用的情况下,上报所述目标组件存在特殊异常。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:由每一个所述集群中的监控脚本监控每一个所述集群中的每一个主机的主机参数指标;在所述主机参数指标超出正常数据范围的情况下,确定对应的所述主机存在异常。6.根据权利要求1至5任意一项所述的方法,其特征在于,所述获取采集模块采集的集群中每一个组件的指标数据包括:调用管理扩展工具JMX采集每一个所述组件的CPU使用率、进程存活状态、读写速率、写读延迟以及负载。7.根据权利要求1...

【专利技术属性】
技术研发人员:赵宇王东侯雪峰
申请(专利权)人:北京金山云网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1