一种告警信息的处理方法、装置和系统制造方法及图纸

技术编号:15987584 阅读:42 留言:0更新日期:2017-08-12 07:02
本发明专利技术实施例公开了一种告警信息的处理方法、装置和系统;本发明专利技术实施例采用接收第一节点在第一时刻产生的告警信息后,若确定该告警信息为根源告警,则获取包含第一节点的链路,得到第一链路集,在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点,然后,对第二节点重新进行告警根源分析,并将分析结果通知给用户;该方案可以提高告警分析的完整性和准确性,从而使得可以及时发现故障或异常,有利于提高系统的稳定性和安全性。

【技术实现步骤摘要】
一种告警信息的处理方法、装置和系统
本专利技术涉及通信
,具体涉及一种告警信息的处理方法、装置和系统。
技术介绍
集群,指的是将多个系统连接到一起,使多台服务器能够像一台机器那样工作或者看起来好像一台机器的相关技术。通过集群技术,可以提高系统的稳定性和网络中心的数据处理能力及服务能力。集群中的应用只在一台服务器上运行,如果这个应用出现故障,其它的某台服务器会重新启动这个应用,接管位于共享磁盘柜上的数据区,进而使应用重新正常运转。但是,由于整个应用的切换过程中需要花费一定的时间,因此,会导致一定的延迟,影响整个集群系统的性能,所以,提前获知设备故障或系统异常显得极为重要。为此,现有技术提出了告警技术,即当设备发生故障或某些原因导致集群系统发生不正常的工作状态时,集群系统能够根据不同类型的故障及不同模块出现的故障产生告警信息,然后,基于这些告警信息进行告警分析,并将分析结果通知给用户,以便用户可以及时对故障或异常进行处理。在对现有技术的研究和实践过程中,本专利技术的专利技术人发现,现有的很多告警,常常会因各种原因而产生延时,使得后续在告警分析时,无法及时获取到完整的告警信息,最终导致分析不准确,从而无法及时发现故障或异常,影响系统的稳定性和安全性。
技术实现思路
本专利技术实施例提供一种告警信息的处理方法、装置和系统,可以提高告警分析的完整性和准确性,从而使得可以及时发现故障或异常,有利于提高系统的稳定性和安全性。本专利技术实施例提供一种告警信息的处理方法,包括:接收第一节点在第一时刻产生的告警信息;确定所述告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集;在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;对所述第二节点进行告警根源分析,并将分析结果通知给用户。相应的,本专利技术实施例还提供一种告警信息的处理装置,包括:接收单元,用于接收第一节点在第一时刻产生的告警信息,得到第一链路集;获取单元,用于确定所述告警信息为根源告警时,获取包含第一节点的链路;查找单元,用于在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;处理单元,用于对所述第二节点进行告警根源分析,并将分析结果通知给用户。此外,本专利技术实施例还提供一种集群系统,包括本专利技术实施例所提供的任一种告警信息的处理装置。本专利技术实施例采用接收第一节点在第一时刻产生的告警信息后,若确定该告警信息为根源告警,则获取包含第一节点的链路,得到第一链路集,在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点,然后,对第二节点重新进行告警根源分析,并将分析结果通知给用户,从而达到动态分析告警的根源的目的,弥补了因某些告警信息延时发出而导致的分析不准的问题,大大提高了告警分析的完整性和准确性,从而便于用户可以及时发现故障或异常,有利于提高系统的稳定性和安全性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1a是本专利技术实施例提供的集群系统的场景示意图;图1b是本专利技术实施例提供的告警信息的处理方法的流程图;图2a是本专利技术实施例提供的告警信息的处理方法的另一流程图;图2b是本专利技术实施例提供的告警信息的处理方法中的链路示意图;图2c是本专利技术实施例提供的告警信息的处理方法中的过滤后的链路示意图;图2d是本专利技术实施例提供的告警信息的处理方法中告警模块和链路叠加后的链路示意图;图2e是本专利技术实施例提供的告警信息的处理方法中进行告警根源分析的链路示意图;图2f是本专利技术实施例提供的告警信息的处理方法中的一链路示意图;图3是本专利技术实施例提供的告警信息的处理装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种告警信息的处理方法、装置和系统。参见图1a,集群系统可以包括控制设备,该控制设备可以包括本专利技术实施例所提供的任一种告警信息的处理装置,此外,该集群系统还可以包括多个节点,比如,节点A、节点B、节点C,……节点N,等等,这些节点用于对该集群系统中的数据进行处理,以提供相应的服务,并且,可以在确定发生故障或异常时产生告警信息,并向控制设备发送该告警信息。而控制设备在接收到该告警信息后,可以对该告警信息进行判断,若确定为根源告警,则获取包含该告警节点(比如,如果节点A发送告警信息,则节点A为告警节点)的链路,在该链路中查找位置位于该告警节点前,并在该告警时间的前后预设时间范围内,比如以该告警时间为基准,前8个时间窗口以及后4个时间窗口内,产生过告警信息的节点,然后,对这些节点重新进行告警根源分析,并将分析结果通知给用户;否则,若确定该告警信息不是根源告警,则可以直接忽略。以下将分别进行详细说明。实施例一、本实施例将从告警信息的处理装置的角度进行描述,该告警信息的处理装置具体可以集成在集群系统的控制设备中,该控制设备具体可以为控制服务器或调控服务器等设备。一种告警信息的处理方法,包括:接收第一节点在第一时刻产生的告警信息;确定该告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集;在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;对该第二节点进行告警根源分析,并将分析结果通知给用户。如图1b所示,该告警信息的处理方法的具体流程可以如下:101、接收第一节点在第一时刻产生的告警信息。需说明的是,由于可能会产生延迟,所以,第一节点产生告警信息的时间(即第一时刻)与发送该告警信息的时间有可能不同,比如,节点C0在12:00点产生的告警信息,可能在12:30点才发出。102、确定该告警信息为根源告警时,获取包含第一节点的链路(业务链路),得到第一链路集。其中,根源告警的内容具体可以根据实际应用的需求进行设置,比如,该根源告警可以包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞等告警,即步骤“确定该告警信息为根源告警时,获取包含第一节点的链路”具体可以为:确定该告警信息指示节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞时,获取包含第一节点的链路,得到第一链路集。例如,如果该告警信息是由节点C0发出的,则此时可以获取包含节点C0的链路,然后,将这些包含节点C0的链路添加到第一链路集中,等等。103、在该第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点。其中,该时间范围可以根据实际应用的需求进行设置,比如,可以设置为在以第一时刻的时间窗为基准,在该基准的前八个时间窗本文档来自技高网...
一种告警信息的处理方法、装置和系统

【技术保护点】
一种告警信息的处理方法,其特征在于,包括:接收第一节点在第一时刻产生的告警信息;确定所述告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集;在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;对所述第二节点进行告警根源分析,并将分析结果通知给用户。

【技术特征摘要】
1.一种告警信息的处理方法,其特征在于,包括:接收第一节点在第一时刻产生的告警信息;确定所述告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集;在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点;对所述第二节点进行告警根源分析,并将分析结果通知给用户。2.根据权利要求1所述的方法,其特征在于,所述确定所述告警信息为根源告警时,获取包含第一节点的链路,得到第一链路集,包括:确定所述告警信息指示节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和/或节点下专线拥塞时,获取包含第一节点的链路,得到第一链路集。3.根据权利要求1所述的方法,其特征在于,所述在所述第一链路集的链路中查找位置位于第一节点前,并在第一时刻的前后预设时间范围内产生过告警信息的节点,得到第二节点,包括:在所述第一链路集的链路中查找位置位于第一节点前的节点,得到候选节点;在所述候选节点中查找在第一时刻的前八个时间窗内,以及后四个时间窗内产生过告警信息的节点,得到第二节点。4.根据权利要求1至3任一项所述的方法,其特征在于,所述对所述第二节点进行告警根源分析,并将分析结果通知给用户,包括:提取包含第二节点的链路,得到第二链路集;根据第二节点的调用关系对所述第二链路集中的链路进行过滤,得到有效链路;根据所述有效链路对所述第二节点进行告警根源分析;将分析结果写入库表,并将分析结果通知给用户。5.根据权利要求4所述的方法,其特征在于,所述根据所述有效链路对所述第二节点进行告警根源分析,包括:确定第二节点的告警时间,得到第二时刻;从所述有效链路中获取在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点;分析第三节点的告警内容,以确定所述告警内容是否为根源告警;若为根源告警,则将所述第三节点作为第一节点,并返回执行获取包含第一节点的链路的步骤;若不是根源告警,则执行将分析结果写入库表,并将分析结果通知给用户的步骤。6.根据权利要求5所述的方法,其特征在于,所述分析第三节点的告警内容,以确定所述告警内容是否为根源告警,包括:分析第三节点的告警内容,以确定所述告警内容是否包括节点发布变更、节点机器丢包、节点下程序崩溃、节点下机器死机和节点下专线拥塞中任意一种;若是,则确定所述告警内容为根源告警;若否,则确定所述告警内容不是根源告警。7.根据权利要求5所述的方法,其特征在于,所述从所述有效链路中确定在第二时刻的前后预设时间范围内产生过告警信息的节点,得到第三节点,包括:以所述第二时刻的时间窗口为基准;从所述有效链路中确定该基准前八个时间窗内,以及后四个时间窗内产生过告警信息...

【专利技术属性】
技术研发人员:赵子青聂鑫梁定安杨波黄浩宇张兰
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1