网络告警根源分析方法、系统、存储介质及计算机设备技术方案

技术编号:19436482 阅读:42 留言:0更新日期:2018-11-14 13:09
本发明专利技术涉及一种网络告警根源分析方法及系统,方法包括:根据网络拓扑关系数据和监控指标数据进行离线分析,获得优选告警元最短可达路径矩阵;基于告警实例发生时间按照预设时间步长对告警实例进行事务划分,根据所述优选告警元最短可达路径矩阵以告警事务为单位进行告警根源分析,确定告警事务中为告警根源的告警实例。本发明专利技术通过网络拓扑关系数据和监控指标数据,将拓扑数据转换为告警元的拓扑矩阵,从告警元的维度来进行分析,更加直观和准确的对实时告警数据进行分析;按照告警发生时间进行聚类,以事务为单位对告警数据进行划分,增强了处于相同时间范围的告警间的联系,降低了按照单个告警进行拓扑检索的数据随机性拓扑复杂性的噪点影响。

【技术实现步骤摘要】
网络告警根源分析方法、系统、存储介质及计算机设备
本专利技术涉及计算机应用
,尤其涉及一种网络告警根源分析方法、系统、介质及计算机设备。
技术介绍
随着信息技术与信息规模的不断发展,网络应用规模也不断扩大,支撑网络应用的设备规模也相应增加。因为业务量的庞大复杂,在日常的运维中,监控支撑系统会产生大量的告警,而运维的人员有限,为了保障服务质量同时降低运维成本,需要一套智能化、高准确率的告警根源分析解决方案,帮助运维人员快速定位问题并消除业务系统故障,确保应用优质、平稳的运行成为了目前智能监控面临的重要问题。网络运维系统中,当应用或者设备发生故障时,监控系统会发出告警信息,并将告警信息推送给系统的运维人员,当运维规模较大时,软硬件网络组件关系复杂,监控系统的监控指标种类繁多,运维人员可能会持续的接收到大量的告警信息,特别是在基础设备故障、新应用上线或系统割接时,这个情况尤为明显,然后这些大量的告警信息中,往往有一些告警是有关联性的,例如:设备磁盘空间不足故障导致了应用的接口故障;套智能化、高准确率的告警根源分析解决方案能通过降低一些低维度告警的重要性,重要(根源)告警的推荐帮助运维人员定位这些问题的根源,快速、高效的处理这些告警,从而实现系统故障的快速回复。现有的告警根源分析技术主要根据网络资源的拓扑关系,直接通过告警的设备信息查找拓扑关系中是否有父或者子节点,来判断当前告警是否是根源告警,或者对网络拓扑关系进行降维处理,将网络拓扑关系分解为多条链路,通过告警实例在链路中所处的位置来判定是否为根源告警,以上技术都是基于网络拓扑关系的一些简单判定,当处于同一链路的告警信息有一定的离散程度时,将造成根源分析的不确定性;特别是目前大多数的监控系统的告警信息依赖于周期性的信息采集,可能关联性比较强的告警信息不是在完全相同的时间点到达监控系统;且直接查找网络拓扑的方法大多只是基于一层拓扑关系进行查找,容易受到交叉链路的影响。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的不足,提供一种网络告警根源分析方法、系统、介质及计算机设备。本专利技术解决上述技术问题的技术方案如下:一种网络告警根源分析方法,包括如下步骤:S1,根据网络拓扑关系数据和监控指标数据进行离线分析,获得优选告警元最短可达路径矩阵;S2,基于告警实例发生时间按照预设时间步长对告警实例进行事务划分,根据所述优选告警元最短可达路径矩阵以告警事务为单位进行告警根源分析,确定告警事务中为告警根源的告警实例。本专利技术解决上述技术问题的技术方案如下:一种网络告警根源分析系统,包括离线分析模块和告警根源确定模块;所述离线分析模块,用于根据网络拓扑关系数据和监控指标数据进行离线分析,获得优选告警元最短可达路径矩阵;所述告警根源确定模块,用于基于告警实例发生时间按照预设时间步长对告警实例进行事务划分,根据所述优选告警元最短可达路径矩阵以告警事务为单位进行告警根源分析,确定告警事务中为告警根源的告警实例。本专利技术解决上述技术问题的技术方案如下:一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使所述计算机执行上述方案所述的方法。本专利技术解决上述技术问题的技术方案如下:一种计算机设备,包括存储器、处理器及存储在所述存储器上的并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方案所述的方法。本专利技术的有益效果是:本专利技术包括基于对已有的网络拓扑关系数据和监控指标数据的离线分析以及实时告警根源分析;通过对已有的网络拓扑关系数据和监控指标数据进行离线分析获得优选告警元最短可达路径矩阵,以优选告警元最短可达路径矩阵作为实时告警根源分析的重要依据,即从告警元的维度来进行分析,更加直观和准确的对实时告警数据进行分析;实时告警根源分析是指对监控系统产生的告警实例进行基于告警时间的时间片事务切分,对切分后的告警事务进行实时在线根源分析,结合离线分析得出的优选告警元最短可达路径矩阵,推荐告警事务中最有可能是告警根源的一个或几个告警,以事务为单位对告警数据进行划分,增强了处于相同时间范围的告警间的联系,降低了按照单个告警进行拓扑检索的数据随机性拓扑复杂性的噪点影响。且本专利技术运行时开销小,离线分析只需要初始化时和拓扑数据更新时计算;实时告警根源分析中,以批次的告警事务进行分析,对告警事务基于优选告警元最短可达路径矩阵遍历,时间复杂度低。本专利技术依赖网络拓扑图,配置简单且易于使用,可广发应用于网络监控与运维领域。附图说明图1为本专利技术实施例提供的网络告警根源分析方法的示意性流程图;图2为本专利技术实施例提供实时告警根源分析流程示意图;图3为本专利技术实施例提供的网络告警根源分析系统框图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。图1给出了本专利技术实施例提供的一种网络告警根源分析方法的示意性流程图。如图1所示,该网络告警根源分析方法包括:S1,根据网络拓扑关系数据和监控指标数据进行离线分析,获得优选告警元最短可达路径矩阵;S2,基于告警实例发生时间按照预设时间步长对告警实例进行事务划分,根据所述优选告警元最短可达路径矩阵以告警事务为单位进行告警根源分析,确定告警事务中为告警根源的告警实例。该实施例中,网络拓扑关系数据:指通过人工绘制或者通过网络中的模块间调用服务分析所得到的网络中的软硬件间的有向关联关系数据;监控指标数据:指监控系统针对软硬件资源进行采集、监控的具体指标,如:主机的CPU利用率;告警数据:指软硬件组件由于相关监控指标数值超过事先所设定的阈值而产生的日志记录,内容包括告警ID、告警产生时间、告警级别等,这些告警信息呈现到监控运维系统得到运维人员的进一步处理。并且,本实施例采用的网络拓扑关系数据、监控指标数据、告警数据为经过预处理的移动行业真实数据。上述实施例中,包括基于对已有的网络拓扑关系数据和监控指标数据的离线分析以及实时告警根源分析;通过对已有的网络拓扑关系数据和监控指标数据进行离线分析获得优选告警元最短可达路径矩阵,以优选告警元最短可达路径矩阵作为实时告警根源分析的重要依据,即从告警元的维度来进行分析,更加直观和准确的对实时告警数据进行分析;实时告警根源分析是指对监控系统产生的告警实例进行基于告警时间的时间片事务切分,对切分后的告警事务进行实时在线根源分析,结合离线分析得出的优选告警元最短可达路径矩阵,推荐告警事务中最有可能是告警根源的一个或几个告警,以事务为单位对告警数据进行划分,增强了处于相同时间范围的告警间的联系,降低了按照单个告警进行拓扑检索的数据随机性拓扑复杂性的噪点影响。且本专利技术运行时开销小,离线分析只需要初始化时和拓扑数据更新时计算;实时告警根源分析中,以批次的告警事务进行分析,对告警事务基于优选告警元最短可达路径矩阵遍历,时间复杂度低。本专利技术依赖网络拓扑图,配置简单且易于使用,可广发应用于网络监控与运维领域。可选地,所述S1包括:S11,基于网络拓扑关系数据样本及监控指标数据样本,获得告警元的有向拓扑关系矩阵;其中所述的网络拓扑关系数据样本指存储在数据库中的网络资源的有向关系记录的集合,所述的监控指标数据样本指存储在数据库中的监控系统指标记录的集合,其中告警元指网络系统中产生告警本文档来自技高网
...

【技术保护点】
1.一种网络告警根源分析方法,其特征在于,包括如下步骤:S1,根据网络拓扑关系数据和监控指标数据进行离线分析,获得优选告警元最短可达路径矩阵;S2,基于告警实例发生时间按照预设时间步长对告警实例进行事务划分,根据所述优选告警元最短可达路径矩阵以告警事务为单位进行告警根源分析,确定告警事务中为告警根源的告警实例。

【技术特征摘要】
1.一种网络告警根源分析方法,其特征在于,包括如下步骤:S1,根据网络拓扑关系数据和监控指标数据进行离线分析,获得优选告警元最短可达路径矩阵;S2,基于告警实例发生时间按照预设时间步长对告警实例进行事务划分,根据所述优选告警元最短可达路径矩阵以告警事务为单位进行告警根源分析,确定告警事务中为告警根源的告警实例。2.根据权利要求1所述的方法,其特征在于,所述S1包括:S11,基于网络拓扑关系数据样本及监控指标数据样本,获得告警元有向拓扑关系矩阵;S12,根据狄克斯特拉算法计算告警元有向拓扑关系矩阵中各个告警元之间的最短可达路径,生成告警元最短可达路径矩阵;S13,根据预设的最短路径阈值对告警元最短可达路径矩阵进行过滤,得到元素值小于或等于最短路径阈值的优选告警元最短可达路径矩阵。3.根据权利要求2所述的方法,其特征在于,所述S13包括:将所述告警元最短可达路径矩阵中元素值大于预设的最短路径阈值的元素值设置为空,得到优选告警元最短可达路径矩阵。4.根据权利要求1所述的方法,其特征在于,S2具体包括:S21,基于告警实例发生时间按照预设时间步长对告警实例进行事务划分;S22,当告警事务中告警实例的告警元存在于优选告警元最短可达路径矩阵中,且所述告警元不存在父节点,则根据优选告警元最短可达路径矩阵确定所述告警实例在本次告警事务中的子告警数目;S23,当所述子告警数目大于预设子告警集合元素个数阈值时,则将所述告警实例标记为告警根源。5.根据权利要求4所述的方法,其特征在于,所述S2还包括:当告警事务中告警实例的告警元不存在于优选告警元最短可达路径矩阵中;或者,告警事务中告警实例的告警元存在于优选告警元最短可达路径矩阵中,但所述告警元...

【专利技术属性】
技术研发人员:谢远航
申请(专利权)人:北京思特奇信息技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1