一种基于设备拓扑和因果关系的异常根因定位方法及装置制造方法及图纸

技术编号:36703025 阅读:20 留言:0更新日期:2023-03-01 09:21
本发明专利技术公开一种基于设备拓扑和因果关系的异常根因定位方法及装置,其中,该方法包括:将网络设备拓扑关系通过图数据库进行保存;收集历史告警信息进行处理,生成待分析数据,利用LiNGAM算法计算出告警因果关系,再利用条件概率公式计算出告警因果关系权重;基于网络设备拓扑关系和告警因果关系及其权重,对实时产生的告警信息进行分析,得出根因链路、根告警以及根设备。该方法及装置利用网络设备的拓扑结构顺序,结合告警的因果关系以及告警发生的时间顺序,可以给出告警的根因链路,并且根据根因链路找到根设备和根告警。根因链路找到根设备和根告警。根因链路找到根设备和根告警。

【技术实现步骤摘要】
一种基于设备拓扑和因果关系的异常根因定位方法及装置


[0001]本专利技术涉及告警根因定位
,尤其是一种基于设备拓扑和因果关系的异常根因定位方法及装置。

技术介绍

[0002]在整个网络短时间内发生大量告警的情况下,需要压缩其中的重复告警并且给出根因告警的链路,找出根因告警,从而降低运维人员面对告警处理时的工作负担。现有的技术方案中,有基于GRANO算法(基于交互式图的根因分析算法)的告警根因定位方法,该方法虽然能有效压缩告警,并通过计算每个告警节点的得分排序来确定根因告警,但是无法给出一条完整的根因链路,根因的可解释性不强。

技术实现思路

[0003]为解决现有的技术方案存在的上述问题,本专利技术提供一种基于设备拓扑和因果关系的异常根因定位方法及装置,利用网络设备的拓扑结构顺序,结合告警的因果关系以及告警发生的时间顺序,可以给出告警的根因链路,并且根据根因链路找到根设备和根告警。
[0004]为实现上述目的,本专利技术采用下述技术方案:
[0005]在本专利技术一实施例中,提出了一种基于设备拓扑和因果关系的异常根因定位方法,该方法包括:
[0006]将网络设备拓扑关系通过图数据库进行保存;
[0007]收集历史告警信息进行处理,生成待分析数据,利用LiNGAM算法计算出告警因果关系,再利用条件概率公式计算出告警因果关系权重;
[0008]基于网络设备拓扑关系和告警因果关系及其权重,对实时产生的告警信息进行分析,得出根因链路、根告警以及根设备。
[0009]进一步地,将网络设备拓扑关系通过图数据库进行保存,包括:
[0010]将每一个网络设备定义为图数据库的一个顶点,将网络设备之间的连接关系定义为图数据库的边,从而将网络设备和网络设备之间的连接关系记录并写入图数据库中。
[0011]进一步地,收集历史告警信息进行处理,生成待分析数据,包括:
[0012]收集历史告警信息,对于每一条历史告警信息,选取该条历史告警信息发生后一个时间切片内的历史告警信息,再利用网络设备之间的连接关系,筛选出两跳以内的网络设备上发生的历史告警信息;
[0013]通过one

hot方式将筛选出的历史告警信息进行处理,生成一条待分析数据。
[0014]进一步地,基于网络设备拓扑关系和告警因果关系及其权重,对实时产生的告警信息进行分析,得出根因链路、根告警以及根设备,包括:
[0015]对于每一条实时产生的告警信息,选取该条实时产生的告警信息发生后一个时间切片内的告警信息;
[0016]通过图数据库得到这些条告警信息中所有的网络设备,再利用网络设备之间的连
接关系,筛选出两跳以内的网络设备,并通过一个单独的图空间来记录两跳以内的网络设备之间的连接关系;
[0017]对图空间中的网络设备进行逐一分析,若一个网络设备上发生了多个告警,则需要确定该网络设备上发生的根告警;
[0018]若图空间中非全连接,则需要以一个连接的子图为单位进行根因定位分析,得到根因链路、根告警以及根设备并汇总。
[0019]进一步地,对于一个网络设备上发生了多个告警,先构建一个有向图,再选取该有向图内按照因果关系权重计算出的最长路径的起点告警作为根告警;若该有向图内无路径存在,则选取最早时间的告警作为根告警。
[0020]进一步地,若图空间中非全连接,则需要以一个连接的子图为单位进行根因定位分析,包括:
[0021]对于每一个连接的子图,先构建一个新有向图,遍历该新有向图的边,将每条边的起点和终点网络设备对应的告警类型与告警因果关系结果进行合并关联,若在告警因果关系结果中能够关联到起点和终点网络设备对应的告警类型的组合,则判断对应的告警因果关系的正方向和反方向的权重值是否存在,若存在则取对应的告警因果关系的正方向和反方向的权重值,再选取告警因果关系的正方向和反方向的权重值中权重值高的为边的实际方向,将其记录到构建的新有向图中,若不存在则告警因果关系权重值记为0;
[0022]在当前新有向图构建完成后,计算其中的所有路径,将告警因果关系权重值之和最高的路径作为根因链路,该根因链路的起始设备为根设备,该根设备上发生的告警为根告警。
[0023]在本专利技术一实施例中,还提出了一种基于设备拓扑和因果关系的异常根因定位装置,该装置包括:
[0024]设备拓扑信息构建模块,用于将网络设备拓扑关系通过图数据库进行保存;
[0025]告警因果关系计算模块,用于收集历史告警信息进行处理,生成待分析数据,利用LiNGAM算法计算出告警因果关系,再利用条件概率公式计算出告警因果关系权重;
[0026]告警根因收敛模块,用于基于网络设备拓扑关系和告警因果关系及其权重,对实时产生的告警信息进行分析,得出根因链路、根告警以及根设备。
[0027]进一步地,设备拓扑信息构建模块,具体用于:
[0028]将每一个网络设备定义为图数据库的一个顶点,将网络设备之间的连接关系定义为图数据库的边,从而将网络设备和网络设备之间的连接关系记录并写入图数据库中。
[0029]进一步地,收集历史告警信息进行处理,生成待分析数据,包括:
[0030]收集历史告警信息,对于每一条历史告警信息,选取该条历史告警信息发生后一个时间切片内的历史告警信息,再利用网络设备之间的连接关系,筛选出两跳以内的网络设备上发生的历史告警信息;
[0031]通过one

hot方式将筛选出的历史告警信息进行处理,生成一条待分析数据。
[0032]进一步地,告警根因收敛模块,具体用于:
[0033]对于每一条实时产生的告警信息,选取该条实时产生的告警信息发生后一个时间切片内的告警信息;
[0034]通过图数据库得到这些条告警信息中所有的网络设备,再利用网络设备之间的连
接关系,筛选出两跳以内的网络设备,并通过一个单独的图空间来记录两跳以内的网络设备之间的连接关系;
[0035]对图空间中的网络设备进行逐一分析,若一个网络设备上发生了多个告警,则需要确定该网络设备上发生的根告警;
[0036]若图空间中非全连接,则需要以一个连接的子图为单位进行根因定位分析,得到根因链路、根告警以及根设备并汇总。
[0037]进一步地,对于一个网络设备上发生了多个告警信息,先构建一个有向图,再选取该有向图内按照因果关系权重计算出的最长路径的起点告警作为根告警;若该有向图内无路径存在,则选取最早时间的告警作为根告警。
[0038]进一步地,若图空间中非全连接,则需要以一个连接的子图为单位进行根因定位分析,包括:
[0039]对于每一个连接的子图,先构建一个新有向图,遍历该新有向图的边,将每条边的起点和终点网络设备对应的告警类型与告警因果关系结果进行合并关联,若在告警因果关系结果中能够关联到起点和终点网络设备对应的告警类型的组合,则判断对应的告警因果关系的正方向和反本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于设备拓扑和因果关系的异常根因定位方法,其特征在于,该方法包括:将网络设备拓扑关系通过图数据库进行保存;收集历史告警信息进行处理,生成待分析数据,利用LiNGAM算法计算出告警因果关系,再利用条件概率公式计算出告警因果关系权重;基于网络设备拓扑关系和告警因果关系及其权重,对实时产生的告警信息进行分析,得出根因链路、根告警以及根设备。2.根据权利要求1所述的基于设备拓扑和因果关系的异常根因定位方法,其特征在于,将网络设备拓扑关系通过图数据库进行保存,包括:将每一个网络设备定义为图数据库的一个顶点,将网络设备之间的连接关系定义为图数据库的边,从而将网络设备和网络设备之间的连接关系记录并写入图数据库中。3.根据权利要求1所述的基于设备拓扑和因果关系的异常根因定位方法,其特征在于,收集历史告警信息进行处理,生成待分析数据,包括:收集历史告警信息,对于每一条历史告警信息,选取该条历史告警信息发生后一个时间切片内的历史告警信息,再利用网络设备之间的连接关系,筛选出两跳以内的网络设备上发生的历史告警信息;通过one

hot方式将筛选出的历史告警信息进行处理,生成一条待分析数据。4.根据权利要求1所述的基于设备拓扑和因果关系的异常根因定位方法,其特征在于,基于网络设备拓扑关系和告警因果关系及其权重,对实时产生的告警信息进行分析,得出根因链路、根告警以及根设备,包括:对于每一条实时产生的告警信息,选取该条实时产生的告警信息发生后一个时间切片内的告警信息;通过图数据库得到这些条告警信息中所有的网络设备,再利用网络设备之间的连接关系,筛选出两跳以内的网络设备,并通过一个单独的图空间来记录两跳以内的网络设备之间的连接关系;对图空间中的网络设备进行逐一分析,若一个网络设备上发生了多个告警,则需要确定该网络设备上发生的根告警;若图空间中非全连接,则需要以一个连接的子图为单位进行根因定位分析,得到根因链路、根告警以及根设备并汇总。5.根据权利要求4所述的基于设备拓扑和因果关系的异常根因定位方法,其特征在于,对于一个网络设备上发生了多个告警,先构建一个有向图,再选取该有向图内按照因果关系权重计算出的最长路径的起点告警作为根告警;若该有向图内无路径存在,则选取最早时间的告警作为根告警。6.根据权利要求4所述的基于设备拓扑和因果关系的异常根因定位方法,其特征在于,若图空间中非全连接,则需要以一个连接的子图为单位进行根因定位分析,包括:对于每一个连接的子图,先构建一个新有向图,遍历该新有向图的边,将每条边的起点和终点网络设备对应的告警类型与告警因果关系结果进行合并关联,若在告警因果关系结果中能够关联到起点和终点网络设备对应的告警类型的组合,则判断对应的告警因果关系的正方向和反方向的权重值是否存在,若存在则取对应的告警因果关系的正方向和反方向的权重值,再选取告警因果关系的正方向和反方向的权重值中权重值高的为边的实际方
向,将其记录到构建的新有向图中,若不存在则告警因果关系权重值记为0;在当前新有向图构建完成后,计算其中的所有路径,将告警因果关系权重值之和最高的路径作为根因链路,该根因链路的起始设备为根设备,该根设备上发生的告警为根告警。7.一种基于设备拓扑和因果关系的异常根因定位装置,其特征在于,该装置包括:设备拓扑信息构建模块,用于将网络设备拓扑关系通过图数据库进行保存;告警因果关系计算模块,用于收集历...

【专利技术属性】
技术研发人员:吴侃周世军覃华云毛恒李敏敏
申请(专利权)人:中盈优创资讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1