一种告警事件的处理方法及装置制造方法及图纸

技术编号:19702495 阅读:23 留言:0更新日期:2018-12-08 14:14
本申请涉及数据分析技术领域,尤其涉及一种告警事件的处理方法及装置,为了在海量告警事件中,及时准确地判定造成根源性故障的告警事件,该方法为,结合当前周期内产生的告警事件和历史周期内产生的未失效的告警事件,各个告警事件各自对应的主体,以及预设的各个主体之间的参考拓扑关系,确定主体事件拓扑关系,并将主体事件拓扑关系划分为若干连通子图,以及从获得的连通子图中筛选出符合预设条件的告警事件作为目标告警事件,这样,能充分考虑到具有关联关系的各个主体,因异步产生具有关联关系的各个故障而触发产生的各个告警事件,可直接确定导致异步触发产生的各个告警事件的根源性故障,减少了故障排除时间,提高了清障效率。

【技术实现步骤摘要】
一种告警事件的处理方法及装置
本申请涉及数据分析
,尤其涉及一种告警事件的处理方法及装置。
技术介绍
为了更好的对网络业务系统、网络资源等进行管理,通常会在相应设备上部署监控点,一旦被监控的设备发生故障,设备对应的监控点就会产生相应的告警事件,以通知管理方进行相应处理,其中,监控点可以是硬件,也可以是软件,而且,监控点可以检测到相应设备发生的硬件故障,也可以检测到相应设备发生的软件故障。然而,随着监控体系的扩大,监控点的增多,每个监控点又能产生多个告警事件,管理方可能会同时接收到大量的告警事件。针对上述情形,相关技术下,仅能通过去除重复的告警事件,完成对告警事件的初步处理,例如,假设设备1发生故障而产生了告警事件A,而由于故障未能及时排除,导致设备1多次重复产生告警事件A,那么,相关技术下,仅能对重复产生的告警事件A进行去重处理。当管理方接收到海量的告警事件时,仅靠去重处理是无法在海量告警事件中及时判定哪些告警事件是由根源性故障触发的,因此无法及时进行故障处理,进而导致故障处理耗时加长,故障处理效率降低。有鉴于此,需要设计一种新的告警事件的处理方法以克服上述缺陷。
技术实现思路
本申请实施例提供一种告警事件的处理方法及装置,用以在海量告警事件中,及时准确地判定造成根源性故障的告警事件。本申请实施例提供的具体技术方案如下:第一方面,一种告警事件的处理方法,包括:获取待处理告警事件集合,其中,所述待处理告警事件集合包含当前周期内产生的最新一批次的告警事件和历史周期内产生的未失效的告警事件;基于所述待处理告警事件集合中包含的至少一个告警事件,所述至少一个告警事件各自对应的主体,以及预设的至少一个主体之间的参考拓扑关系,确定所述待处理告警事件集合对应的主体事件拓扑关系,并将所述主体事件拓扑关系划分为若干连通子图,其中,不同连通子图包含的节点之间不存在关联关系,一个节点表征一个主体以及所述一个主体对应的至少一个告警事件;对获得的连通子图执行以下操作:从连通子图中筛选出符合预设条件的告警事件作为目标告警事件,并基于所述目标告警事件确定相应的根源性故障。可选的,获取待处理告警事件集合,包括:从预设的各个监控点收集当前周期内产生的最新一批次的告警事件,以及从指定存储区域中获取已缓存的历史周期内产生的未失效的告警事件,其中,一个告警事件未失效表征对应所述一个告警事件设置的存活期TTL未超时;将获取的所述最新一批次的告警事件与所述未失效的告警事件进行合并,获得待处理告警事件集合。可选的,基于所述待处理告警事件集合中包含的至少一个告警事件,所述至少一个告警事件各自对应的主体,以及预设的至少一个主体之间的参考拓扑关系,确定所述待处理告警事件集合对应的主体事件拓扑关系,包括:确定所述待处理告警事件集合中包含的至少一个告警事件各自对应的主体,并基于预设的至少一个主体之间的参考拓扑关系,确定所述待处理告警事件集合中对应的至少一个主体之间的主体拓扑关系;基于所述待处理告警事件集合中包含的至少一个告警事件,以及所述至少一个告警事件各自对应的主体,对所述待处理告警事件集合中对应的至少一个主体之间的主体拓扑关系进行调整,获得所述待处理告警事件集合的主体事件拓扑关系。可选的,从连通子图中筛选出符合预设条件的告警事件作为目标告警事件,包括:从所述连通子图中筛选出符合第一预设条件的主体作为目标主体;从所述目标主体对应的至少一个告警事件中筛选出符合第二预设条件的告警事件作为目标告警事件。可选的,从连通子图中筛选出符合第一预设条件的主体作为目标主体,包括:基于网页排名算法,分别计算所述连通子图对应的至少一个主体的网页排名值,其中,一个主体的网页排名值与所述一个主体关联的其它主体的数目相关联;从所述连通子图对应的至少一个主体中,筛选出最大网页排名值对应的主体作为目标主体。可选的,进一步包括:若所述最大网页排名值对应的主体存在至少两个,则从所述最大网页排名值对应的主体中,筛选出具有最高目标优先级的主体作为目标主体。可选的,从最大网页排名值对应的主体中,筛选出具有最高目标优先级的主体作为目标主体,包括:基于预设的至少一个告警事件的处理优先级,确定所述最大网页排名值对应的主体所关联的至少一个告警事件的处理优先级;基于所述最大网页排名值对应的主体所关联的至少一个告警事件的处理优先级,确定所述最大网页排名值对应的主体各自对应的目标优先级;从所述最大网页排名值对应的主体中筛选出具有最高目标优先级的主体作为目标主体。可选的,进一步包括:若具有最高目标优先级的主体存在至少两个,则从所述至少两个主体中随机选取一个主体作为目标主体。可选的,从所述目标主体对应的至少一个告警事件中筛选出符合第二预设条件的告警事件作为目标告警事件,包括:基于预设的至少一个告警事件的处理优先级,确定所述目标主体对应的至少一个告警事件的处理优先级;基于所述目标主体对应的至少一个告警事件的处理优先级,从所述目标主体对应的至少一个告警事件中,筛选出具有最高处理优先级的告警事件作为目标告警事件。第二方面,一种告警事件的处理方法,包括:基于用户触发的获取指令,获取待处理告警事件集合,并将所述待处理告警事件集合呈现给用户,其中,所述待处理告警事件集合包含当前周期内产生的最新一批次的告警事件和历史周期内产生的未失效的告警事件;接收到用户基于所述待处理告警事件集合触发的拓扑关系确认指令时,基于所述待处理告警事件集合中包含的至少一个告警事件,所述至少一个告警事件各自对应的主体,以及预设的至少一个主体之间的参考拓扑关系,确定所述待处理告警事件集合对应的主体事件拓扑关系,以及将所述主体事件拓扑关系划分为若干连通子图,并将所述若干连通子图呈现给用户,其中,不同连通子图包含的节点之间不存在关联关系,一个节点表征一个主体以及所述一个主体对应的至少一个告警事件;接收到用户基于所述若干连通子图触发的目标告警事件确认指令时,对获得的连通子图执行以下操作:从连通子图中筛选出符合预设条件的告警事件作为目标告警事件,并将所述目标告警事件呈现给用户;接收到用户基于至少一个目标告警事件触发的根源性故障确认指令时,针对获得的至少一个目标告警事件,分别确定相应的根源性故障并呈现给用户。第三方面,一种故障源检测方法,包括:获取告警事件集合,其中,所述告警事件集合中的告警事件分别与计算设备对应;基于所述告警事件集合以及参考拓扑关系,获取目标告警事件;基于所述目标告警事件确定相应的故障源。可选的,所述告警事件集合包括当前周期内产生的告警事件和历史周期内产生的未失效的告警事件。可选的,基于所述告警事件集合以及参考拓扑关系,获取目标告警事件包括:将所述告警事件集合中的告警事件映射到所述参考拓扑关系,得到目标拓扑关系,其中,所述目标拓扑关系中的计算设备包括告警事件;获取目标拓扑关系中的连通子图,其中,不同连通子图包含的节点之间不存在关联关系,一个节点表征一个主体以及所述一个主体对应的至少一个告警事件;从所述连通子图中筛选出符合预设条件的告警事件作为目标告警事件。可选的,所述参考拓扑关系包括多个计算设备之间的故障拓扑关系,故障拓扑关系包括计算设备之间引起故障的关系。可选的,其中,所述连通子图为有向连通子图;其中,从所述连通子图中筛选出符合本文档来自技高网...

【技术保护点】
1.一种告警事件的处理方法,其特征在于,包括:获取待处理告警事件集合,其中,所述待处理告警事件集合包含当前周期内产生的最新一批次的告警事件和历史周期内产生的未失效的告警事件;基于所述待处理告警事件集合中包含的至少一个告警事件,所述至少一个告警事件各自对应的主体,以及预设的至少一个主体之间的参考拓扑关系,确定所述待处理告警事件集合对应的主体事件拓扑关系,并将所述主体事件拓扑关系划分为若干连通子图,其中,不同连通子图包含的节点之间不存在关联关系,一个节点表征一个主体以及所述一个主体对应的至少一个告警事件;对获得的连通子图执行以下操作:从连通子图中筛选出符合预设条件的告警事件作为目标告警事件,并基于所述目标告警事件确定相应的根源性故障。

【技术特征摘要】
1.一种告警事件的处理方法,其特征在于,包括:获取待处理告警事件集合,其中,所述待处理告警事件集合包含当前周期内产生的最新一批次的告警事件和历史周期内产生的未失效的告警事件;基于所述待处理告警事件集合中包含的至少一个告警事件,所述至少一个告警事件各自对应的主体,以及预设的至少一个主体之间的参考拓扑关系,确定所述待处理告警事件集合对应的主体事件拓扑关系,并将所述主体事件拓扑关系划分为若干连通子图,其中,不同连通子图包含的节点之间不存在关联关系,一个节点表征一个主体以及所述一个主体对应的至少一个告警事件;对获得的连通子图执行以下操作:从连通子图中筛选出符合预设条件的告警事件作为目标告警事件,并基于所述目标告警事件确定相应的根源性故障。2.如权利要求1所述的方法,其特征在于,获取待处理告警事件集合,包括:从预设的各个监控点收集当前周期内产生的最新一批次的告警事件,以及从指定存储区域中获取已缓存的历史周期内产生的未失效的告警事件,其中,一个告警事件未失效表征对应所述一个告警事件设置的存活期TTL未超时;将获取的所述最新一批次的告警事件与所述未失效的告警事件进行合并,获得待处理告警事件集合。3.如权利要求1或2所述的方法,其特征在于,基于所述待处理告警事件集合中包含的至少一个告警事件,所述至少一个告警事件各自对应的主体,以及预设的至少一个主体之间的参考拓扑关系,确定所述待处理告警事件集合对应的主体事件拓扑关系,包括:确定所述待处理告警事件集合中包含的至少一个告警事件各自对应的主体,并基于预设的至少一个主体之间的参考拓扑关系,确定所述待处理告警事件集合中对应的至少一个主体之间的主体拓扑关系;基于所述待处理告警事件集合中包含的至少一个告警事件,以及所述至少一个告警事件各自对应的主体,对所述待处理告警事件集合中对应的至少一个主体之间的主体拓扑关系进行调整,获得所述待处理告警事件集合的主体事件拓扑关系。4.如权利要求1所述的方法,其特征在于,从连通子图中筛选出符合预设条件的告警事件作为目标告警事件,包括:从所述连通子图中筛选出符合第一预设条件的主体作为目标主体;从所述目标主体对应的至少一个告警事件中筛选出符合第二预设条件的告警事件作为目标告警事件。5.如权利要求4所述的方法,其特征在于,从连通子图中筛选出符合第一预设条件的主体作为目标主体,包括:基于网页排名算法,分别计算所述连通子图对应的至少一个主体的网页排名值,其中,一个主体的网页排名值与所述一个主体关联的其它主体的数目相关联;从所述连通子图对应的至少一个主体中,筛选出最大网页排名值对应的主体作为目标主体。6.如权利要求5所述的方法,其特征在于,进一步包括:若所述最大网页排名值对应的主体存在至少两个,则从所述最大网页排名值对应的主体中,筛选出具有最高目标优先级的主体作为目标主体。7.如权利要求6所述的方法,其特征在于,从最大网页排名值对应的主体中,筛选出具有最高目标优先级的主体作为目标主体,包括:基于预设的至少一个告警事件的处理优先级,确定所述最大网页排名值对应的主体所关联的至少一个告警事件的处理优先级;基于所述最大网页排名值对应的主体所关联的至少一个告警事件的处理优先级,确定所述最大网页排名值对应的主体各自对应的目标优先级;从所述最大网页排名值对应的主体中筛选出具有最高目标优先级的主体作为目标主体。8.如权利要求7所述的方法,其特征在于,进一步包括:若具有最高目标优先级的主体存在至少两个,则从所述至少两个主体中随机选取一个主体作为目标主体。9.如权利要求4-8任一项所述的方法,其特征在于,从所述目标主体对应的至少一个告警事件中筛选出符合第二预设条件的告警事件作为目标告警事件,包括:基于预设的至少一个告警事件的处理优先级,确定所述目标主体对应的至少一个告警事件的处理优先级;基于所述目标主体对应的至少一个告警事件的处理优先级,从所述目标主体对应的至少一个告警事件中,筛选出具有最高处理优先级的告警事件作为目标告警事件。10.一种告警事件的处理方法,其特征在于,包括:基于用户触发的获取指令,获取待处理告警事件集合,并将所述待处理告警事件集合呈现给用户,其中,所述待处理告警事件集合包含当前周期内产生的最新一批次的告警事件和历史周期内产生的未失效的告警事件;接收到用户基于所述待处理告警事件集合触发的拓扑关系确认指令时,基于所述待处理告警事件集合中包含的至少一个告警事件,所述至少一个告警事件各自对应的主体,以及预设的至少一个主体之间的参考拓扑关系,确定所述待处理告警事件集合对应的主体事件拓扑关系,以及将所述主体事件拓扑关系划分为若干连通子图,并将所述若干连通子图呈现给用户,其中,不同连通子图包含的节点之间不存在关联关系,一个节点表征一个主体以及所述一个主体对应的至少一个告警事件;接收到用户基于所述若干连通子图触发的目标告警事件确认指令时,对获得的连通子图执行以下操作:从连通子图中筛选出符合预设条件的告警事件作为目标告警事件,并将所述目标告警事件呈现给用户;接收到用户基于至少一个目标告警事件触发的根源性故障确认指令时,针对获得的至少一个目标告...

【专利技术属性】
技术研发人员:刘雄浩
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1