【技术实现步骤摘要】
一种告警风暴的处理方法及装置
本专利技术实施例涉及互联网
,具体涉及一种告警风暴的处理方法及装置。
技术介绍
在网络设备管理系统中,故障管理是重要的一环,故障管理的主要目的是监控系统中各个网络设备的工作情况,收集各个网络设备的状态信息或者故障信息,并对这些信息进行相应的处理。当由于设备故障或某种不可控的原因造成系统某个软硬件资源异常时,有可能在短时间内产生大量的告警信息,这种短时间内大量告警信息的上报被称为告警风暴。目前,对告警风暴的处理策略主要有以下几种:(1)对告警风暴不处理,直接上报;(2)使用告警黑名单,对符合告警黑名单的告警风暴进行丢弃、过滤或合并;(3)使用计数器进行过滤,对于相同的告警信息进行累加,定期清零并展示或者对在给定时间段内出现的相同告警信息的次数超过阈值的告警信息进行过滤;(4)利用告警特征进行过滤:利用告警信息的特征,保留主要告警,丢弃或缓存次要告警。上述对告警风暴的处理策略存在以下问题:对于(1)的方式,会导致占用系统内存的激增,消息队列消息堆积严重,CPU资源被占用,严重时甚至导致 ...
【技术保护点】
1.一种告警风暴的处理方法,其特征在于,包括:/n接收各个网络设备通过各自的告警上报通道上报的告警信息;其中,所述告警上报通道是预先建立的,所述告警上报通道与所述网络设备一一对应;/n若判断获知所述网络设备上报的告警信息满足告警风暴判断规则,则关闭所述网络设备的告警上报通道。/n
【技术特征摘要】
1.一种告警风暴的处理方法,其特征在于,包括:
接收各个网络设备通过各自的告警上报通道上报的告警信息;其中,所述告警上报通道是预先建立的,所述告警上报通道与所述网络设备一一对应;
若判断获知所述网络设备上报的告警信息满足告警风暴判断规则,则关闭所述网络设备的告警上报通道。
2.根据权利要求1所述的方法,其特征在于,所述告警风暴判断规则包括:
预设时间段内所述网络设备上报的相同的所述告警信息的数量大于阈值。
3.根据权利要求1所述的方法,其特征在于,还包括:
通过所述网络设备的状态查询通道周期性查询获得满足所述告警风暴判断规则的告警信息对应的监控对象的状态;其中,所述状态查询通道是预先建立的,所述状态查询通道与所述网络设备一一对应;
若判断获知满足所述告警风暴判断规则的告警信息对应的监控对象的状态满足预设条件,则重建所述网络设备的告警上报通道并停止对所述网络设备的周期性查询。
4.根据权利要求1所述的方法,其特征在于,还包括:
通过所述网络设备的状态查询通道周期性查询获得满足所述告警风暴判断规则的告警信息对应的监控对象的状态;其中,所述状态查询通道是预先建立的,所述状态查询通道与所述网络设备一一对应;
若判断获知满足所述告警风暴判断规则的告警信息对应的监控对象的状态满足预设条件,则通过所述状态查询通道查询获得所述网络设备的其它监控对象的状态;
若判断获知所述网络设备的其它监控对象的状态都为正常,则重建所述网络设备的告警上报通道并停止对所述网络设备的周期性查询。
5.根据权利要求4所述的方法,其特征在于,还包括:
若判断获知所述网络设备的其它监控对象的状态中至少一个存在异常,则通过所述网络设备的状态查询通道周期性查询获得所述网络设备的所有监控对象的状态;
若判断获知所述网络设备的所有监控对象的状态都是正常,则重建所述网络设备的告警上报通道并停止对所述网络设备的周期性查询。
6.根据权利要求3或4所述的方法,其特征在于,所述预设条件包括:
满足...
【专利技术属性】
技术研发人员:杨洋,
申请(专利权)人:普天信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。