分布式节点指标与告警缓存方法、装置和电子设备制造方法及图纸

技术编号:36514428 阅读:18 留言:0更新日期:2023-02-01 15:44
本申请涉及一种分布式节点指标与告警缓存方法、装置和电子设备,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关;所述告警网关接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存;所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存。达到被缓存数据不会被周期性地反复重试发送造成网络和告警系统的资源被过度占用的功效,避免因同一个网络故障原因造成指标发送延迟的各个节点不会同时将数据集中上传;被缓存数据不会触发告警,但会被打上标签,通过告警系统模拟出告警事件,被记录。被记录。被记录。

【技术实现步骤摘要】
分布式节点指标与告警缓存方法、装置和电子设备


[0001]本公开涉及分布式储存
,尤其涉及一种分布式节点指标与告警缓存方法、装置和电子设备。

技术介绍

[0002]由于SD

WAN的Underlay网络是基于不可靠的互联网,而告警的机制基本上又是基于来自各个节点上报的各种指标(如温度、带宽、CPU使用率等),当因Underlay网络质量的原因造成指标无法上报,将无法发送的指标缓存在节点内部即可,等Underlay网络恢复正常后再发送即可,再由告警系统负责处理和存储那些迟到的数据。
[0003]而缓存告警并伺机重新发送会带来以下问题:如果长时间断网(非故障,而是项目需要故意长期断网)却不断电,可能会造成节点中缓存的指标数据量过大,(极端情况会造成存储崩溃,一般通过Rotate来解决),即使在非极端情况下,网络恢复时,集中的指标上传也会占用过大的网络带宽与告警系统的资源;如果发生故障的Underlay网络是拓扑的骨干处,会造成一大串节点发生缓存,同样地,当网络恢复正常时,所有的节点同时上传被缓存的指标数据,也会占用过大的网络带宽与告警系统的资源;如果被缓存的数据触发了告警,则是过时的大量告警,引起运维人员的反感并掩盖了真正有用的告警;但如果不触发告警,在审计时又会引起不必要的辩解,与普通的系统相比,这是SD

WAN系统特有的一个两难的问题。

技术实现思路

[0004]为了解决上述问题,本申请提出一种分布式节点指标与告警缓存方法、装置和电子设备。
>[0005]本申请一方面,提出一种分布式节点指标与告警缓存方法,包括如下步骤:通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关;所述告警网关接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存;所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存。
[0006]作为本申请的一可选实施方案,可选地,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关,包括:判断网络质量,获取网络状态:当所述网络状态处于正常状态时,通过所述采集节点采集数据,并直接将所述采集数据发送至所述告警网关。
[0007]作为本申请的一可选实施方案,可选地,通过采集节点采集数据,并根据网络状
态,将采集数据发送至告警网关,还包括:判断网络质量,获取网络状态:当网络质量处于非正常状态时,通过所述采集节点采集数据,将所述采集数据发送并保存至缓存模块,并对每条所述采集数据进行缓存标记,得到指标数据;通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关。
[0008]作为本申请的一可选实施方案,可选地,通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关,包括:预设上报所述指标数据的重试时间,并将所述重试时间配置于所述缓存模块上;所述缓存模块根据所述重试时间,反复重试上报所述指标数据;其中,所述重试时间频率为:T(n+1) = T(n) * (1.5
‑ꢀ
2.0) * (0.9

1.1)T(n+1) 为下一次上报时间,T(n) 为首次间隔时间。
[0009]作为本申请的一可选实施方案,可选地,所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存,包括:所述时序数据库接收所述指标数据,并判断所述指标数据是否具备缓存标记:若所述指标数据不具备所述缓存标记,则保存所述指标数据,并用于读取展示;若所述指标数据具备所述缓存标记,则保存具备所述缓存标记的所述指标数据,并用于读取展示。
[0010]作为本申请的一可选实施方案,可选地,所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存,包括:所述告警系统判断引擎接收所述指标数据,并根据预设告警条件判断所述指标数据是否触发告警:若触发告警,则将所述指标数据发送并保存至告警系统事件记录模块;若未触发告警,则将所述指标数据发送至下一节点。
[0011]作为本申请的一可选实施方案,可选地,在触发告警时,还包括:判断所述指标数据是否具备缓存标记:若所述指标数据不具备缓存标记,则将告警信息发送至告警系统发送引擎,通过所述告警系统发送引擎通知接收人;若所述指标数据具备缓存标记,则连同所述缓存标记一并保存所述指标数据。
[0012]作为本申请的一可选实施方案,可选地,在触发告警时,还包括:若所述指标数据不具备缓存标记,即所述指标数据为实时数据,则所述告警系统判断引擎根据实时计算规则,实时计算所述指标数据的上报时间;若所述指标数据具备缓存标记,即所述指标数据为非实时数据,则所述告警系统判断引擎根据限时计算规则,异步计算所述指标数据的上报时间。
[0013]本申请另一方面,提供一种实现上述所述的分布式节点指标与告警缓存方法的装置,包括:采集节点,用于采集数据,并根据网络状态,将采集数据发送至告警网关;缓存模块,用于缓存采集节点在网络质量处于非正常状态时发送的采集数据,并对每条所述采集数据进行缓存标记后发送至告警网关;
告警网关,用于接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;时序数据库,用于接收所述指标数据,并根据所述指标数据的属性进行保存;数据展示模块,用于对接所述时序数据库并展示所述时序数据库中的数据;告警系统判断引擎,用于接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警处理;告警系统事件记录模块,用于缓存告警处理后的指标数据;告警系统发送引擎,用于将不具备缓存标记的告警信息发送至接收人。
[0014]本申请另一方面,还提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行所述可执行指令时实现上述所述的分布式节点指标与告警缓存方法。
[0015]本专利技术的技术效果:本申请通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关;所述告警网关接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存;所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存。达到被缓存数据不会被周期性地反复重试发送造成网络和告警系统的资源被过度占用;因同一个网络故障原因造成指标发送延迟的各个节点不会同时将数据集中上传;被缓存的数据不会触发告警,但会被打上标签,并在UI中以明显的方式展示这个标签,说明当时没有触发告警的原因,但是被缓存的数据依然会通过告警系统模拟出告警事件,在系统中被记录。
[0016]根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
[0017]包含在说明书中并且构成说明书的一部分本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.分布式节点指标与告警缓存方法,其特征在于,包括如下步骤:通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关;所述告警网关接收所述采集数据,并将处于预设网络状态下所形成的指标数据,分别发送至时序数据库和告警系统判断引擎;所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存;所述告警系统判断引擎接收并保存所述指标数据,并根据预设告警条件对所述指标数据进行告警缓存。2.根据权利要求1所述的分布式节点指标与告警缓存方法,其特征在于,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关,包括:判断网络质量,获取网络状态:当所述网络状态处于正常状态时,通过所述采集节点采集数据,并直接将所述采集数据发送至所述告警网关。3.根据权利要求2所述的分布式节点指标与告警缓存方法,其特征在于,通过采集节点采集数据,并根据网络状态,将采集数据发送至告警网关,还包括:判断网络质量,获取网络状态:当网络质量处于非正常状态时,通过所述采集节点采集数据,将所述采集数据发送并保存至缓存模块,并对每条所述采集数据进行缓存标记,得到指标数据;通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关。4.根据权利要求3所述的分布式节点指标与告警缓存方法,其特征在于,通过所述缓存模块,伺机将具备缓存标记的所述指标数据上报至告警网关,包括:预设上报所述指标数据的重试时间,并将所述重试时间配置于所述缓存模块上;所述缓存模块根据所述重试时间,反复重试上报所述指标数据;其中,所述重试时间频率为:T(n+1) = T(n) * (1.5
‑ꢀ
2.0) * (0.9

1.1)T(n+1) 为下一次上报时间,T(n) 为首次间隔时间。5.根据权利要求1所述的分布式节点指标与告警缓存方法,其特征在于,所述时序数据库接收所述指标数据,并根据所述指标数据的属性进行保存,包括:所述时序数据库接收所述指标数据,并判断所述指标数据是否具备缓存标记:若所述指标数据不具备所述缓存标记,则保存所述指标数据,并用于读取展示;若所述指标数据具备所述缓存标记,则保存具备所述缓存标记的所述指标数据,并用于读取展示。6.根据权利要求1所述的分布式节点指标与告警缓...

【专利技术属性】
技术研发人员:姜作毅陈睿彧张新
申请(专利权)人:北京天维信通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1