一种基于关联分析的链式监控事件根因分析方法技术

技术编号:20865735 阅读:42 留言:0更新日期:2019-04-17 09:12
本发明专利技术公开了一种基于关联分析的链式监控事件根因分析方法。以预定义的指标链树为参考,对于频繁同时发生的两条监控事件,分别提取两个不同的监控类型,提取第一条事件的监控类型为A,提取第二条事件的监控类型为B,并根据事件A和事件B的数量做比较和预判:若得到指标链为A小于B,则事件A更靠近指标链树根节点,并且以A为链接点,将此指标链添加到指标链树中;若A和B相同,则并列添加到指标链树中上一层的应用节点。针对报警风暴,将从监控事件中所得的报警类型与已经生成的指标链树做匹配,根据与根节点的报警距离确定根因报警,其他报警可以聚合到该根因报警中去。采用这样的方法,可以解决报警数量多导致运维排障效率低、过度依赖运维人员个人经验和技术的问题,有助于高效恢复业务,保障业务系统的稳定运行。

【技术实现步骤摘要】
一种基于关联分析的链式监控事件根因分析方法
本专利技术属于计算机系统和应用监控
,特别涉及一种基于关联分析的链式监控事件根因分析方法。
技术介绍
在现有技术解决方案中,事件处理缺乏对多指标深度复杂场景的报警关联和聚合,遇到网络、数据库、核心系统异常容易产生报警风暴,跨系统的报警缺乏根因定位和快速发现,对监控事件压缩智能在定制化的情况下做到单个事件数量的累计,使得在面对大量的监控报警时,排障工作主要依赖运维人员的经验。目前的监控报警系统存在以下不足:一是报警孤立。当前业务平台一般都涉及若干系统,系统之间都存在依赖,报警中缺乏其关联信息,同时收到的多条报警,需要逐一排查才能追溯哪一个报警是根因;二是故障根因分析效率慢。常见监控产品尚无有效的根因报警分析策略,收到大量的监控报警,需要运维人员执行若干命令,查询若干数据,基于经验和知识库进行判断异常原因,效率不高;三是大量报警。当系统关键节点发送故障,容易产生大量报警,缺乏有效聚合会导致报警风暴,干扰判断,造成资源浪费。
技术实现思路
本专利技术要解决的技术问题在于当报警风暴产生,跨系统的报警缺乏根因定位和快速发现,排障工作效率低,主要依靠运维人的经验。为解决上述问题,本专利技术提供一种基于关联分析的链式监控事件根因分析方法,能够解决如下技术问题:一是实现故障根因分析。在报警风暴当中,必定有少量的报警是导致其他报警发生的根本原因,通过根因分析技术,能够找出这些根因报警;二是有效应对报警风暴。当同时爆发大量的报警时,通过报警压缩技术可以有效的减少报警数量。本专利技术提供一种基于关联分析的链式监控事件根因分析方法,能够取得如下技术效果:一是,通过本专利技术可以快速发现根因报警,据此可以将由其引发的其他报警都聚合到这条根因报警当中,从而实现故障根因分析;二是,报警通知量明显减少(短信、邮件等),可以有效应对报警风暴,让运维人员从有效报警当中更快的发现问题、解决问题,减少无效报警的干扰。本专利技术提供一种基于关联分析的链式监控事件根因分析方法,该根因分析方法包括:1)将监控系统的监控指标分类,每一类根据指标权重抽象为树形结构,以预定义指标链树;2)结合历史报警数据生成指标链,扩充指标链树;3)提取当前监控报警的监控类型,匹配指标链树;4)分析指标链树,得到根因报警。所述监控指标,是指监控系统对监控对象进行检测的一个项目,并需要根据监控对象的运行情况对其设定一个阙值,当采集到的数据不符合阙值时会触发监控的报警事件。所述指标链,是指根据关联分析结果,经常同时发生的监控报警,极有可能有内在联系,因此可以形成一条指标链。所述指标链树,是指多条指标链的相同节点以靠近根节点为原则进行合并,形成树状结构的指标链树。所述关联分析,又称关联挖掘,是指可以发现存在于大量数据集中的关联性或相关性,从而描述了一个事务中某些属性同时出现的规律和模式。在此可以用来挖掘出经常同时发生的事件。所述指标权重,系现有技术,是指在整体数量中所占的比例大小量化值,将某个事物所含各个指标权重之和视为1,其中每个指标的权重用小数表示。进一步地,为了应对报警风暴的发生,根据实际的监控系统配置情况,将监控指标进行分组归类,每一类根据指标权重区分根节点和叶子节点,抽象成为树形结构,预定义指标链树。所述报警风暴,指的是监控系统在短期内发生的大量监控报警的现象。进一步地,为了生成指标链,针对同时发生的两条监控事件,分别提取两个不同的监控类型,提取第一条事件的监控类型为A,提取第二条事件的监控类型为B。进一步地,为了判断报警数量,从指标链树中查找是否包含第一条事件的监控类型A、B的规则:如是,则计算权重;如否,则分析监控类型A和监控类型B的数量。进一步地,为了生成指标链,分析监控类型A和监控类型B的数量:若A的数量少于B的数量,则暂定指标链为A小于B;若A的数量和B的数量相等,则A和B并列,不生成新的指标链。进一步地,为了与指标树相匹配,若得到指标链为A小于B,则事件A更靠近指标链树根节点,并且以A为链接点,将此指标链添加到指标链树中;若A和B并列,挂在指标链树上层的应用节点。进一步地,为了判断是否为根因报警,将监控所得的报警类型与已经生成的指标链树做匹配,根据与根节点的报警距离确定根因报警。所述根节点,属于现有技术,是指除本身外所有节点的祖先,没有父节点,即指没有上一级节点。所述根因报警,是指如果一条监控报警发生后,会引发数条其他的报警,这一条报警便是这一组监控报警中的根因报警。进一步地,其他报警可以聚合到根因报警中去。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明下面结合附图对本专利技术的具体实施方式做进一步详细的说明,其中:图1是根据一示例性实施例示出基于关联分析的链式监控事件根因分析方法流程图;图2是根据一示例性实施例示出的预定义指标链树示意图;图3是根据一示例性实施例示出的生成指标链示意图;图4是根据一示例性实施例示出的匹配指标链示意图。具体实施方式为更容易理解本专利技术的优点、特征以及达到技术效果的技术方法将参照例示性实施例进行更详细地描述,且本专利技术可以不同形式来实现,故不应被理解为本专利技术仅限于此处所陈述的实施例,相反地,对本领域的技术人员,所提供的实施例将更加透彻与全面且完整地传达本专利技术的范畴,且本专利技术将以申请专利文件的权利要求确定保护范围。以下结合附图对本申请进行进一步的说明。如图1所示,本实施例为模拟一个报警风暴产生,采用关联分析的链式监控事件进行根因分析,有效提取进行根因分析和快速发现。如图2所示,根据实际的监控系统配置情况,将监控指标进行分组归类,每一类根据指标权重来区分根节点和叶子节点,从而抽象成为树形结构,预定义一颗指标链树。某应用的发生1条进程CPU使用率100%报警,1条内存使用超过90%报警,同时端口8031、8032、8033共有3条报警,1条java进程报警,2条网址访问超时报警,3条API接口状态报警,3条F5端口状态报警,共计14条监控报警事件,报警风暴产生。如图3所示,经过结合历史事件的关联分析,发现某应用APP曾频繁同时发生java进程报警PROC_java,8031端口报警PORT_8031,和API接口异常状态报警API_03,以及F5检测到的端口状态报警F5_8031,根据指标链生成规则,可得到一条具体的指标链:进程报警APP_PROC_java->端口报警APP_PORT_8031->API_03,由于端口报警PORT_8031和F5_8031是一一对应的关系,查询指标链树模板发现已有PROC->PORT->API这样一条指标链的预定义,F5_8031挂在PORT_8031的后面;经过对历史事件的关联分析,能发现进程PROC_java下面还有PORT_8032和PORT_8033两个端口的指标链,统一都挂在指标链树的PROC_java节点。由此可以得到一棵针对某应用APP的java进程的监控指标链树。如图4所示,将上述14条报警事件与指标链树匹配,分析监控事件,每一个方格对应1条监控报警,从指标链树中可分析出java进程已占用100%CPU,根因事件就是最靠近根节点的一条swap内存占用过高报警。分析出了这1条根因报警本文档来自技高网...

【技术保护点】
1.一种基于关联分析的链式监控事件根因分析方法,其特征在于,包括如下步骤:1)将监控系统的监控指标分类,每一类根据指标权重抽象为树形结构,以预定义指标链树;2)结合历史报警数据生成指标链,扩充指标链树;3)提取监控报警的监控类型,匹配指标链树;4)分析指标链树,得到根因报警。

【技术特征摘要】
1.一种基于关联分析的链式监控事件根因分析方法,其特征在于,包括如下步骤:1)将监控系统的监控指标分类,每一类根据指标权重抽象为树形结构,以预定义指标链树;2)结合历史报警数据生成指标链,扩充指标链树;3)提取监控报警的监控类型,匹配指标链树;4)分析指标链树,得到根因报警。2.根据权利要求1所述的基于关联分析的链式监控事件根因分析方法,其特征在于,根据实际的监控系统配置情况,将监控指标进行分组归类,每一类根据指标权重区分根节点和叶子节点,抽象成为树形结构,预定义指标链树。3.根据权利要求1所述的基于关联分析的链式监控事件根因分析方法,其特征在于,生成所述指标链时,若同时发生两条监控事件,分别提取两个不同的监控类型,提取第一条事件的监控类型为A,提取第二条事件的监控类型为B。4.根据权利要求3所述的基于关联分析的链式监控事件根因分析方法,其特征在于,生成所述指标链时,从指标链树中查找是否包含第一条事件的监控类型A、B的规则;如是,则计算权重;...

【专利技术属性】
技术研发人员:鞠向明
申请(专利权)人:中信百信银行股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1