一种服务器集群监控及告警系统技术方案

技术编号:36935976 阅读:15 留言:0更新日期:2023-03-22 18:57
本发明专利技术公开了一种服务器集群监控及告警系统,属于服务器集群监控技术领域。该系统包括硬件指标采集器、任务指标采集器、组件指标采集器、Prometheus单元、VictoriaMetrics单元、APIServer单元以及告警监控配置模块;Prometheus单元分别与硬件指标采集器,任务指标采集器、组件指标采集器以及VictoriaMetrics单元连接;VictoriaMetrics单元还与APIServer单元连接;APIServer单元还与告警监控配置模块连接。本发明专利技术解决了目前的服务器集群监控系统采集零散以及多集群管理困难等问题。难等问题。难等问题。

【技术实现步骤摘要】
一种服务器集群监控及告警系统


[0001]本专利技术涉及服务器集群监控
,尤其涉及一种服务器集群监控及告警系统。

技术介绍

[0002]现有的服务器集群监控体系下,主要以脚本和关系型数据库存储的方式进行指标采集和数据的本地化存储,存在许多缺陷,例如在现有的监控系统中,新的监控数据接入无法规范化管理,且新增步骤繁琐,维护困难,此外,还存在多集群管理困难的问题,现有的监控体系一般都是单独集群单独部署,面对多集群的复杂场景往往无能为力。
[0003]因此亟需一种服务器集群监控及告警系统,以解决现有的服务器集群监控系统采集零散、多集群管理困难等问题。

技术实现思路

[0004]本专利技术旨在提出一种服务器集群监控及告警系统,以解决目前的服务器集群监控系统采集零散以及多集群管理困难等问题。
[0005]为实现上述目的,本专利技术提供以下技术方案:一种服务器集群监控及告警系统,包括硬件指标采集器、任务指标采集器、组件指标采集器、Prometheus单元、VictoriaMetrics单元、APIServer单元以及告警监控配置模块;所述Prometheus单元分别与所述硬件指标采集器,所述任务指标采集器、所述组件指标采集器以及所述VictoriaMetrics单元连接;所述VictoriaMetrics单元还与所述APIServer单元连接;所述APIServer单元还与所述告警监控配置模块连接;所述硬件指标采集器,用于采集UNIX操作系统的内置目录下的性能指标文本数据,并将采集的所述性能指标文本数据进行处理,得到第一处理指标数据,并将所述第一处理指标数据以标准网络请求接口暴露;所述任务指标采集器,用于通过数据库接口运行查询语句采集业务任务数据库中的指标数据,并将采集的指标数据以标准网络请求接口暴露;所述组件指标采集器,用于采集大数据组件暴露出的轻量级数据交换格式数据,并将采集的轻量级数据交换格式数据进行处理,得到第二处理指标数据,并将所述第二处理指标数据以标准网络请求接口暴露;所述Prometheus单元,用于周期性地发起探测请求以获取以标准网络请求接口暴露的指标数据以及指标数据对应的探测请求时间;所述VictoriaMetrics单元,用于以时序存储格式存储所述Prometheus单元获取的指标数据以及指标数据对应的探测请求时间;所述APIServer单元,用于通过调用查询请求,从所述VictoriaMetrics单元中调用所请求的时间段的指标数据,以使所述VictoriaMetrics单元将调用的指标数据以轻量级数据交换格式返回;所述告警监控配置模块,用于配置告警信息以及监控信息,并根据配置的告警信息和监控信息向所述APIServer单元发送所述查询请求。
[0006]可选地,所述告警监控配置模块包括控制台、告警配置单元、监控配置单元、告警通知单元以及监控展示单元;所述控制台与所述告警配置单元以及所述监控配置单元连接,所述告警配置单元与所述告警通知单元连接,所述监控配置单元与所述监控展示单元连接;所述控制台,用于控制所述告警配置单元以及所述监控配置单元;所述告警配置单元,用于通过所述控制台配置告警指标、告警方式以及告警指标对应的告警触发阈值;所述监控配置单元,用于通过所述控制台配置监控指标以及监控指标展示方式;所述监控展示单元,用于根据所述监控配置单元配置的监控指标以及监控指标展示方式进行监控指标展示;所述告警通知单元,用于根据所述告警配置单元配置的告警指标、告警方式以及告警指标对应的告警触发阈值进行告警通知。
[0007]可选地,所述VictoriaMetrics单元将存储数据进行分布式存储。
[0008]可选地,所述Prometheus单元,还用于对获取的指标数据标记对应的指标类别以及指标环境。
[0009]可选地,所述硬件指标采集器,还用于将采集的文本数据中的第一列文本数据作为指标名称,第二列数据作为指标值,得到第一处理指标数据。
[0010]可选地,所述任务指标采集器采集的指标数据包括任务名称、任务开始时间、任务结束时间、任务占用的内存资源以及任务占用的CPU资源。
[0011]可选地,所述组件指标采集器,还用于将采集的轻量级数据交换格式数据中的key值作为指标名称,value值作为指标值,得到第二处理指标数据。
[0012]本专利技术提供了一种服务器集群监控及告警系统,本系统对每个集群内的服务器进行统一化部署、插件化管理,硬件、组件以及任务指标采集器可以通过告警监控配置模块随时增减指标项,基于Prometheus对多集群指标进行区分,使用一套监控体系即可同时管理多个大数据集群,解决了目前的服务器集群监控系统采集零散以及多集群管理困难等问题。
附图说明
[0013]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1为本专利技术服务器集群监控及告警系统第一实施例的框架示意图一;图2为本专利技术服务器集群监控及告警系统第一实施例的框架示意图二。
具体实施方式
[0015]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与专利技术相关的部分。
[0016]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实
体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0017]目前,现有的服务器集群监控体系主要以脚本和关系型数据库存储的方式进行指标采集和数据的本地化存储,存在许多缺陷,例如在现有的监控系统中,新的监控数据接入无法规范化管理,且新增步骤繁琐,维护困难,此外,还存在多集群管理困难的问题,现有的监控体系一般都是单独集群单独部署,面对多集群的复杂场景往往无能为力。
[0018]针对于此,本针对于此,本专利技术实施例提供了一种服务器集群监控及预警系统,在本系统中,Prometheus单元会周期性地发起探测请求以获取实时性能指标数据以及指标数据对应的探测请求时间,不同的指标数据由不同的指标采集器进行采集并处理,指标数据以及指标数据对应的探测请求时间以时序存储格式长期存入VictoriaMetrics单元中。APIServer单元根据告警监控配置模块配置的告警信息和监控信息调用查询请求,从VictoriaMetric本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务器集群监控及告警系统,其特征在于,包括硬件指标采集器、任务指标采集器、组件指标采集器、Prometheus单元、VictoriaMetrics单元、APIServer单元以及告警监控配置模块;所述Prometheus单元分别与所述硬件指标采集器,所述任务指标采集器、所述组件指标采集器以及所述VictoriaMetrics单元连接;所述VictoriaMetrics单元还与所述APIServer单元连接;所述APIServer单元还与所述告警监控配置模块连接;所述硬件指标采集器,用于采集UNIX操作系统的内置目录下的性能指标文本数据,并将采集的所述性能指标文本数据进行处理,得到第一处理指标数据,并将所述第一处理指标数据以标准网络请求接口暴露;所述任务指标采集器,用于通过数据库接口运行查询语句采集业务任务数据库中的指标数据,并将采集的指标数据以标准网络请求接口暴露;所述组件指标采集器,用于采集大数据组件暴露出的轻量级数据交换格式数据,并将采集的轻量级数据交换格式数据进行处理,得到第二处理指标数据,并将所述第二处理指标数据以标准网络请求接口暴露;所述Prometheus单元,用于周期性地发起探测请求以获取以标准网络请求接口暴露的指标数据以及指标数据对应的探测请求时间;所述VictoriaMetrics单元,用于以时序存储格式存储所述Prometheus单元获取的指标数据以及指标数据对应的探测请求时间;所述APIServer单元,用于通过调用查询请求,从所述VictoriaMetrics单元中调用所请求的时间段的指标数据,以使所述VictoriaMetrics单元将调用的指标数据以轻量级数据交换格式返回;所述告警监控配置模块,用于配置告警信息以及监控信息,并根据配置的告警信息和监控信息向所述APIServer单元发送所述查询请求。2.根据...

【专利技术属性】
技术研发人员:李嘉栋张宇平王鑫鲍烈华苗荟
申请(专利权)人:德特赛维技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1