一种基于告警数据分析的网络告警根源定位方法技术

技术编号:19067353 阅读:192 留言:0更新日期:2018-09-29 14:43
本发明专利技术公布了一种基于告警数据分析的网络告警根源定位方法,包括基于告警历史数据的建模分析步骤以及在线告警根源定位步骤;首先,通过对告警历史数据样本进行分析,挖掘网络告警之间的时序关联关系,从而建立告警元间的网络拓扑;在此基础上,将实时告警映射到所建立的网络拓扑中,基于当前告警对应的告警元在网络拓扑中的相对位置推断告警根源。本方法不需要使用网络硬件连接关系、业务逻辑依赖关系以及其他专家经验知识,开发、维护成本低;同时,本方法能够充分利用真实系统中告警发生的概率与分布特征,具有较高的分析准确性。

【技术实现步骤摘要】
一种基于告警数据分析的网络告警根源定位方法
本专利技术涉及计算机应用
,尤其涉及一种基于告警数据分析的网络告警根源定位方法。
技术介绍
电信网络系统中,软硬组件通过应用调用以及网络连接而相互关联。当系统中的某些组件发生故障或监控指标出现异常时,与其相关联的组件或应用会受到不同程度的影响。因此,当某些组件发生告警后,相应链路上与其相关联的组件可能随之发生告警。为了确保网络系统平稳运行,需要快速定位告警根源以消除网络故障隐患。其中,根源告警指在某一时刻已发生的告警中,不是由其他告警引发且引发了其他告警的告警;而衍生告警指在某一时刻已发生的告警中,由于其他告警元产生告警而引发的关联告警。现有的网络故障定位技术主要包括以下三个方面。第一,基于网络运维实践中抽象出的专家经验,采用规则推理、神经网络、决策树等人工智能技术进行故障定位;第二,基于网络硬件的拓扑结构信息,采用依赖图、贝叶斯网络等图论技术进行故障溯源;第三,基于网络组件间的调用关系,采用模型追溯技术进行网络故障根源分析。相关技术均或多或少依赖于既有的网络硬件连接关系或业务逻辑关联信息。然而,在大规模网络系统中,网络硬件间的物理连接关系以及应用间的逻辑依赖关系及其复杂。这些关联关系还会随着业务更新和系统升级而动态变化,因此难以建立和维护准确而全面的网络拓扑关系。另一方面,即使能够建立庞大的应用拓扑关系,在告警根源分析中真实使用的信息量往往也较小。例如,当某些及其复杂的应用调用路径仅偶尔被访问或者运行十分稳定时,相应的网络拓扑信息在告警根源分析中的利用率较低。因此,长期维护网络组件或应用调用等拓扑关系还面临成本-收益问题。此外,从告警根源分析的角度,尽管告警传播方向与网络的物理拓扑以及应用调用关系密切相关,这些先验的静态信息也并不能直接反映实际系统中告警发生的概率与分布情况。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于告警数据分析的网络告警根源定位方法,解决现有告警根源定位技术过度依赖先验的物理连接或应用调用关系的问题。本专利技术的目的是通过以下技术方案来实现的:一种基于告警数据分析的网络告警根源定位方法,包括离线分析步骤和告警根源在线分析步骤;所述的离线分析步骤包括以下子步骤:S11:遍历告警数据样本,计算各个告警元发生告警时引发其他告警元发生告警的条件概率;其中,所述的告警数据样本指存储在数据库中的历史告警记录集合,所述的告警元:指网络系统中产生告警的最小单元;S12:设置置信度阈值,根据条件概率矩阵生成邻接矩阵;S13:根据上述邻接矩阵获得告警元间的网络拓扑关系;S14:进行环路检测,并消除网络中的环路;所述的告警根源在线分析步骤包括以下子步骤:S21:收集当前发生的所有告警,将这些告警对应的告警元组成集合M;S22:将集合M中的告警元投影到离线分析步骤中所建立的拓扑网络中;S23:结合网络拓扑结构,通过分析当前告警所对应的告警元在网络中的位置定位告警根源。进一步地,步骤S11包括以下子步骤:S111:对于每一个告警元A,统计告警数据样本中告警元A的告警实例数量,同时获取其每个告警实例A.a的关联告警集合,以及与告警元A对应的所有关联告警集合ΨA=∪ΨA.a;其中,所述的告警实例指告警元产生的一条告警数据,告警实例A.a的关联告警集合为告警实例A.a发生期间,发生过告警的其他告警元集合;S112:依次计算每一个告警元A引发其他各个任意告警元B发生告警的条件概率P(B|A),公式如下:式中,SB|A为告警元A的所有告警实例的关联告警集合中包含告警元B的关联告警集合数;SA为告警元A的告警实例数;α为条件阈值;而SB|A的计算方法如下:SB|A=|ΨB|A|,ΨB|A={ΨA.x|告警元B∈ΨA.x};S113:将所有告警元引发其他告警元发生告警的条件概率组织成一个条件概率矩阵:进一步地,在步骤S12中,对于条件概率矩阵中的任意元素P(B|A),若P(B|A)大于置信度阈值,则将邻接矩阵中P(B|A)对应的元素置为1,否则置为0;此外,对所有告警元A,将邻接矩阵中P(A|A)对应的元素置为0。进一步地,在步骤S13中,对于条件概率矩阵中的元素P(B|A),若其对应的元素在邻接矩阵中的数值为1,则认为告警元A可能引发告警元B发生告警。进一步地,步骤S14包括以下子步骤:设置环路规模阈值,当构成环的告警元数小于等于该阈值时,对环路中的告警元进行标记,将其合并为一个逻辑告警元;否则,结合条件概率矩阵,将邻接矩阵中构成环路的边按相应的条件概率值从小到大的顺序依次置0,直至环路消除。进一步地,步骤S23包括以下子步骤:S231:对于集合M中的所有告警元,依次作以下判断:对于集合M中的告警元A,若在邻接矩阵中存在从告警元A到集合M中其他任意告警元的边,且不存在从集合M中其他任意告警元到告警元A的边,则进一步执行S232;否则,继续对集合M中的下一个告警元进行分析,直到集合M中所有告警元均分析完毕;S232:若S231所述满足条件的告警元A为环路合并而成的逻辑告警元,则继续执行步骤S233,否则判定告警元A所对应的告警为当前的告警根源;S233:当S231所述满足条件的告警元A为环路合并而成的逻辑告警元时,若该环路上所有告警元均发生告警,则判定该环路上所有告警元对应的告警均为告警根源,否则,将满足以下条件的告警元X所对应的告警作为当前的告警根源:对于告警元X,不存在从集合M中其他任何告警元到告警元X的边。本专利技术的有益效果是:(1)本方法首先通过对告警历史数据样本进行分析,挖掘网络告警之间的时序关联关系,从而建立告警元间的网络拓扑;在此基础上,将实时告警映射到所建立的网络拓扑中,基于当前告警对应的告警元在网络拓扑中的相对位置推断告警根源。不需要深入理解和维护网络系统的拓扑结构、应用调用关系、网络组件依赖关系等复杂信息,因此开发、维护成本低。(2)本方法通过对告警历史数据进行分析而建立网络拓扑,因此本方法能够反映真实系统中告警发生的概率与分布特征,对于解决告警根源定位问题更具有针对性。附图说明图1为本专利技术整体流程图;图2为本专利技术离线分析步骤流程图;图3为本专利技术告警根源在线分析步骤流程图。具体实施方式下面结合附图进一步详细描述本专利技术的技术方案:本实施例采用的告警数据为经过数据清洗的电信行业真实数据,包括告警元ID、告警实例产生时间、告警实例消除时间等信息。如图1所示,一种基于告警数据分析的网络告警根源定位方法,包括离线分析步骤和告警根源在线分析步骤;如图2所示,所述的离线分析步骤包括以下子步骤:S11:遍历告警数据样本,计算各个告警元发生告警时引发其他告警元发生告警的条件概率;其中,所述的告警数据样本指存储在数据库中的历史告警记录集合,所述的告警元:指网络系统中产生告警的最小单元;优选地,在本实施例中,步骤S11包括以下子步骤:S111:对于每一个告警元A,统计告警数据样本中告警元A的告警实例数量SA,同时获取其每个告警实例A.a的关联告警集合ΨA.a,以及与告警元A对应的所有关联告警集合ΨA=∪ΨA.a;其中,所述的告警实例指告警元产生的一条告警数据,告警实例A.a的关联告警集合为告警实例A.a发生期间,发生过告警的其他告警元集合;S112:依本文档来自技高网
...

【技术保护点】
1.一种基于告警数据分析的网络告警根源定位方法,其特征在于:包括离线分析步骤和告警根源在线分析步骤;所述的离线分析步骤包括以下子步骤:S11:遍历告警数据样本,计算各个告警元发生告警时引发其他告警元发生告警的条件概率;其中,所述的告警数据样本指存储在数据库中的历史告警记录集合,所述的告警元:指网络系统中产生告警的最小单元;S12:设置置信度阈值,根据条件概率矩阵生成邻接矩阵;S13:根据上述邻接矩阵获得告警元间的网络拓扑关系;S14:进行环路检测,并消除网络中的环路;所述的告警根源在线分析步骤包括以下子步骤:S21:收集当前发生的所有告警,将这些告警对应的告警元组成集合M;S22:将集合M中的告警元投影到离线分析步骤中所建立的拓扑网络中;S23:结合网络拓扑结构,通过分析当前告警所对应的告警元在网络中的位置定位告警根源。

【技术特征摘要】
1.一种基于告警数据分析的网络告警根源定位方法,其特征在于:包括离线分析步骤和告警根源在线分析步骤;所述的离线分析步骤包括以下子步骤:S11:遍历告警数据样本,计算各个告警元发生告警时引发其他告警元发生告警的条件概率;其中,所述的告警数据样本指存储在数据库中的历史告警记录集合,所述的告警元:指网络系统中产生告警的最小单元;S12:设置置信度阈值,根据条件概率矩阵生成邻接矩阵;S13:根据上述邻接矩阵获得告警元间的网络拓扑关系;S14:进行环路检测,并消除网络中的环路;所述的告警根源在线分析步骤包括以下子步骤:S21:收集当前发生的所有告警,将这些告警对应的告警元组成集合M;S22:将集合M中的告警元投影到离线分析步骤中所建立的拓扑网络中;S23:结合网络拓扑结构,通过分析当前告警所对应的告警元在网络中的位置定位告警根源。2.根据权利要求1所述的一种基于告警数据分析的网络告警根源定位方法,其特征在于:步骤S11包括以下子步骤:S111:对于每一个告警元A,统计告警数据样本中告警元A的告警实例数量,同时获取其每个告警实例A.a的关联告警集合,以及与告警元A对应的所有关联告警集合ΨA=∪ΨA.a;其中,所述的告警实例指告警元产生的一条告警数据,告警实例A.a的关联告警集合为告警实例A.a发生期间,发生过告警的其他告警元集合;S112:依次计算每一个告警元A引发其他各个任意告警元B发生告警的条件概率P(B|A),公式如下:式中,SB|A为告警元A的所有告警实例的关联告警集合中包含告警元B的关联告警集合数;SA为告警元A的告警实例数;α为条件阈值;而SB|A的计算方法如下:SB|A=|ΨB|A|,ΨB|A={ΨA.x|告警元B∈ΨA.x};S113:将所有告警元引发其他告警元发生告警的条件概率组织成一个条件概率矩阵:3.根据权利要求2所述的一种基于告警数据分析的网络...

【专利技术属性】
技术研发人员:杨茂林王自升陈丹张世俊李璨宇宋仕肖谢远航徐庆洲黄函李永生于泽楠曾援晰李晓瑜雷航
申请(专利权)人:北京思特奇信息技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1