一种故障分析方法及装置制造方法及图纸

技术编号:32752841 阅读:15 留言:0更新日期:2022-03-23 18:48
提供一种故障分析方法及装置,涉及信息安全技术领域,该故障分析方法可通过服务器来执行,也可通过具有是数据处理功能的网络设备来执行,在执行时先要获取来自网络的多个告警事件以及多个告警事件间的关联,之后根据多个告警事件间的关联,以及经验告警事件的关联权重,将多个告警事件分为至少两个故障集合,每个故障集合包括多个告警事件中的至少两个告警事件,最后按照至少两个故障集合的划分输出多个告警事件。由于集合内的故障有更强的关联性,运维人员只需浏览一个集合中的一些告警事件就可以判断该集合中的告警事件是否为次要告警事件,从而可以略过该集合中的其余告警事件而将注意力迅速转向下一集合,通过该方式可提高网络运维效率。提高网络运维效率。提高网络运维效率。

【技术实现步骤摘要】
一种故障分析方法及装置


[0001]本申请涉及信息安全
,尤其涉及一种故障分析方法及装置。

技术介绍

[0002]随着网络规模的不断扩大,网络运维主要存在以下两种问题:一、设备告警数量大,超出了运维人员的处理能力。二、运维人员需要根据设备告警人工定位根因和故障,效率低下。有些告警事件是频繁规律出现的,网络运维时并无需关心这类的告警事件,但是现有技术中,在运维人员进行设备维护时,网络输出大量的告警事件,需要运维人员根据经验值来确定,哪些告警事件是重要告警事件,哪些告警事件是次要告警事件,告警事件对应哪些故障,该方式费时费力。

技术实现思路

[0003]基于此,本申请提供一种故障分析方法及装置,以提高告警事件的处理效率。
[0004]第一方面,本申请提供一种故障分析方法,该方法可通过服务器来执行,也可通过具有数据处理功能的网络设备来执行,在此不做具体限定。该方法在执行时,需要先获取来自网络的多个告警事件以及多个告警事件间的关联;根据多个告警事件间的关联,以及经验告警事件的关联权重,将多个告警事件分为至少两个故障集合,每个故障集合包括多个告警事件中的至少两个告警事件;按照至少两个故障集合的划分输出多个告警事件。
[0005]上述的网络可以理解为包括多个网络设备的网络,其中,所述网络设备可以为交换机、路由器等设备,该网络可以理解为园区网、数据中心网,也可以理解为其他网络在此不做具体限定。此外,上述的网络还可以理解为网络协议,上述的告警事件中可包括:告警名称、告警时间、告警发生位置(在网络为网络协议时,该发生位置还可以为告警发生节点)等。上述告警事件间的关联可以为告警事件在时间上、空间上或逻辑上的关联。上述的经验告警事件的关联权重可以理解为关于告警事件间关联的重要性的经验数据。
[0006]将告警事件划分到不同集合中,可以方便运维人员根据故障集合更好处理告警事件。由于集合内的故障有更强的关联性,运维人员只需浏览一个集合中的一些告警事件就可以判断该集合中的告警事件是否为次要告警事件,从而可以略过该集合中的其余告警事件而将注意力迅速转向下一集合,进而提高网络运维效率。
[0007]在一种可能的实现方式中,所述经验告警事件的关联权重包括来自所述网络之外的经验告警事件的关联权重,或根据所述网络的历史告警事件得到的经验告警事件的关联权重,或根据所述网络的历史告警事件对来自所述网络之外的经验告警事件的关联权重修正后得到的经验告警事件的关联权重。
[0008]在一种可能的实现方式中,获取来自网络的多个历史告警事件以及所述多个历史告警事件间的关联,所述多个历史告警事件中包括至少两个相同的历史告警事件;根据所述相同的历史告警事件和与所述相同的历史告警事件关联的历史告警事件,确定所述相同的历史告警事件与其他历史告警事件间的关联的权重关联权重;将所述多个历史告警事件
间的关联的权重关联权重的集合作为所述经验告警事件关联权重。
[0009]基于历史告警事件的以及历史告警事件间的关联,确定经验告警事件关联权重,之后根据该经验告警事件关联权重确定网络中的故障,可以提高告警事件的分类效率。
[0010]在一种可能的实现方式中,所述相同的历史告警事件与其他历史告警事件间的关联的权重关联权重包括所述相同的历史告警事件的发生时间和所述其他历史告警事件的发生时间的接近程度。
[0011]考虑到历史告警事件的发生时间以及其他历史告警事件的发生时间的接近程度,以便更好确定告警事件之间的关联。假定在过去一年的时间内,历史告警事件1与历史告警事件2发生的时间间隔总是在预设时间范围内,例如,历史告警事件1在时刻1以及时刻3发生,历史告警事件2在时刻2以及时刻4发生,其中,时刻1与时刻2相差时间在预设时间范围内,时刻3与时刻4相差时间也在预设时间范围内,那么历史告警事件1与历史告警事件2很可能是基于同一故障触发的。上述示例仅做示意性描述,实际历史告警事件1并不限于仅仅发生在时刻1以及时刻3还可能发生在其他时刻,历史告警事件2也并不限于仅仅发生在时刻2以及时刻4还可能发生在其他时刻,无论历史告警事件1以及历史告警事件2发生在哪个时刻,2个告警事件最临近的发生时刻经常处于预设时间范围内,则可认为历史告警事件1与历史告警事件2在发生时间的接近程度较高。
[0012]本申请通过确定历告警事件的发生时间以及其他历史告警事件的发生时间的接近程度,可提高告警事件的分类效率。
[0013]在一种可能的实现方式中,所述相同的历史告警事件与其他历史告警事件间的关联的权重关联权重包括所述相同的历史告警事件和所述其他历史告警事件的发生位置的接近程度。
[0014]考虑到历史告警事件的发生位置以及其他历史告警事件的发生位置的接近程度,以便更好确定告警事件之间的关联。假定在过去一年的时间内,历史告警事件1在设备1的接口1发生多次,历史告警事件2在设备1的接口2发生多次,历史告警事件1与历史告警事件2总是发生在同一设备的不同接口,可认为历史告警事件1与历史告警事件2的发生位置的接近程度较高;亦或者,历史告警事件1在设备1的接口1发生历史告警事件2在设备1的接口2发生,历史告警事件1在设备2的接口1发生历史告警事件2在设备2的接口2发生,历史告警事件1与历史告警事件2总是发生在同一设备中,可认为历史告警事件1与历史告警事件2的发生位置的接近程度较高。
[0015]本申请通过确定历告警事件的发生位置以及其他历史告警事件的发生位置的接近程度,可提高告警事件的分类效率。
[0016]在一种可能的实现方式中,所述相同的历史告警事件与其他历史告警事件间的关联的权重关联权重包括第一接近程度和第二接近程度的函数,所述第一接近程度为所述相同的历史告警事件的发生时间和所述其他历史告警事件的发生时间的接近程度,所述第二接近程度为所述相同的历史告警事件和所述其他历史告警事件的发生位置的接近程度。
[0017]考虑历史告警事件的发生时间以及发生位置的接近程度分别对应第一接近程度函数以及第二接近程度函数,以便于在确定权重时参考的时间和空间的因素,使得在确定告警事件对应的故障集合时,获取的结果更加准确可靠。
[0018]在一种可能的实现方式中,根据所述经验告警事件关联权重,在所述至少两个故
障集合中的每个故障集合中确定一个根因告警事件。
[0019]每个故障集合中,确定故障集合对应的根因告警事件,便于网络运维人员及时发现网络故障原因,更加精准地解决网络故障,该方式可以提高网络运维的效率。
[0020]第二方面,本申请提供一种故障分析装置,包括:获取单元、处理单元以及信息输出单元。
[0021]其中,获取单元,用于获取来自网络的多个告警事件以及所述多个告警事件间的关联;处理单元,用于根据所述多个告警事件间的关联,以及经验告警事件的关联权重,将所述多个告警事件分为至少两个故障集合,每个所述故障集合包括所述多个告警事件中的至少两个告警事件;信息输出单元,用以按照所述至少两个故障集合的划分输出所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障分析方法,其特征在于,包括:获取来自网络的多个告警事件以及所述多个告警事件间的关联;根据所述多个告警事件间的关联,以及经验告警事件的关联权重,将所述多个告警事件分为至少两个故障集合,每个所述故障集合包括所述多个告警事件中的至少两个告警事件;按照所述至少两个故障集合的划分输出所述多个告警事件。2.根据权利要求1所述的方法,其特征在于,所述经验告警事件的关联权重包括来自所述网络之外的经验告警事件的关联权重,或根据所述网络的历史告警事件得到的经验告警事件的关联权重,或根据所述网络的历史告警事件对来自所述网络之外的经验告警事件的关联权重修正后得到的经验告警事件的关联权重。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:获取来自网络的多个历史告警事件以及所述多个历史告警事件间的关联,所述多个历史告警事件中包括至少两个相同的历史告警事件;根据所述相同的历史告警事件和与所述相同的历史告警事件关联的历史告警事件,确定所述相同的历史告警事件与其他历史告警事件间的关联的权重;将所述多个历史告警事件间的关联的权重的集合作为所述经验告警事件关联权重。4.根据权利要求3所述的方法,其特征在于,所述相同的历史告警事件与其他历史告警事件间的关联的权重包括所述相同的历史告警事件的发生时间和所述其他历史告警事件的发生时间的接近程度。5.根据权利要求3或4所述的方法,其特征在于,所述相同的历史告警事件与其他历史告警事件间的关联的权重包括所述相同的历史告警事件和所述其他历史告警事件的发生位置的接近程度。6.根据权利要求3-5中任意一项所述的方法,其特征在于,所述相同的历史告警事件与其他历史告警事件间的关联的权重包括第一接近程度和第二接近程度的函数,所述第一接近程度为所述相同的历史告警事件的发生时间和所述其他历史告警事件的发生时间的接近程度,所述第二接近程度为所述相同的历史告警事件和所述其他历史告警事件的发生位置的接近程度。7.根据权利要求1-6中任意一项所述的方法,其特征在于,还包括:根据所述经验告警事件关联权重,在所述至少两个故障集合中的每个故障集合中确定一个根因告警事件。8.一种故障分析装置,其特征在于,包括:获取单元,用于获取来自网络的多个告警事件以及所述多个告警事件间的关联;处理单元,用于根据所述多个告警事件间的关联,以及经验告警事件的关联权重,将所述多个告警事件分为至少两个故障集合,每个所述故障集合包括所述多个告警事件中的至少两个告警事件;信息输出单元,用以按照所述至少两个故障集合的划...

【专利技术属性】
技术研发人员:彭岳
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1