一种低延迟的告警解析处理方法技术

技术编号:12662951 阅读:84 留言:0更新日期:2016-01-07 00:14
一种低延迟的告警解析处理方法,是运用在网管系统的范畴内,包括:各采集机与被网管的设备通过网络通信,收集被管理设备发生故障时产生的告警信息,并统一告警信息的格式;告警服务器和存储设备详细信息的数据库通过网络通信,其中,告警服务器能够缓存设备的详细信息,并定时更新缓存;各采集机通过网络通信向告警服务器上报告警信息,告警服务器中的告警接收器收集告警信息,并转交给告警派发器,告警派发器按照分发原则将告警信息分发到相应的告警处理器中;告警处理器使用缓存对告警信息进行解析,以及对告警信息的处理任务进行派发。本发明专利技术能够实现告警解析处理的有序并发,实现告警主流程任务,可广泛应用于类似系统信息的收集和集中处理。

【技术实现步骤摘要】

本专利技术涉及一种告警解析处理方法。特别是涉及一种低延迟的告警解析处理方法
技术介绍
网管系统为保证实时反应设备的告警信息、指标随时间变化的预警信息,系统采用了jms消息服务机制,建立前后台(数据采集和数据集中处理)的消息通道,及时通知给中间件,通过MQ或jbossmessage发送各个客户端,保证了客户端同步性和实时性。由于告警数据通过网络来源于全国各地的数据采集机对设备(路由器、交换机等通信设备)的告警信进行收集,并通过网络上传至总部的告警服务器进行集中处理。告警的来源途径见表1。表1由上表可分析出:告警的来源众多,数据量较大,根据告警的发生顺序线性解析处理,且要求必须准实时处理。所以必须设计一套即时解析并按规则处理的告警解析方法,才能满足大规模运营商集中管理各个分公司的告警监控体系。所以,目前需要解决如下问题:1.告警数量大、部分业务必须要求线性执行(不允许无序并发);2.解析告警数据需要和告警设备匹配(告警对象是在一定条件下发生变化的);3.告警处理的主流程是多个线性有序处理规则的集合(主流程必须等待所有规则完成)。
技术实现思路
本专利技术所要解决的技术问题是:提供一种能够实现告警解析处理的有序并发,使用缓存机制实现告警信息和告警设备的低延迟解析,实现告警主流程任务的分发的低延迟的告警解析处理方法。本专利技术所采用的技术方案是:一种低延迟的告警解析处理方法,是运用在网管系统的范畴内,包括如下步骤:A)各采集机与被网管的设备通过网络通信,收集被管理设备发生故障时产生的告警信息,并统一告警信息的格式;B)告警服务器和存储设备详细信息的数据库通过网络通信,其中,告警服务器能够缓存设备的详细信息,并定时更新缓存;C)各采集机通过网络通信向告警服务器上报告警信息,告警服务器中的告警接收器收集告警信息,并转交给告警派发器,告警派发器按照分发原则将告警信息分发到相应的告警处理器中;D)告警处理器使用缓存对告警信息进行解析,以及对告警信息的处理任务进行派发,所述的对告警信息进行解析,包括如下步:1)告警处理器解析告警信息,即使用资源缓存匹配告警对象;2)告警处理器处理告警信息,将告警信息和告警设备的详细信息分别派发到对应短信通知任务队列的短信处理者、对应邮件通知任务队列的邮件处理者、以及对应用于存入数据库的告警入库任务队列的告警入库处理者。步骤A)所述的告警信息包括:故障名称、故障原因、故障设备的编号、故障等级以及发生故障的时间。所述的故障等级包括:紧急、主要、次要、警告。步骤B)中所述的定时更新缓存,是指告警服务器的资源缓存每隔设定的时间扫描数据库内被管设备数据是否发生更新变化,若发生更新变化则清空资源缓存,重新加载。所述被管设备数据变化包括:增加新设备、扩容板卡、拔出板卡。步骤C)所述的分发原则是:设定告警处理器的个数为m,将告警设备唯一标识除以告警处理器的个数m,当得到余数为0的告警信息分配在第一告警处理器中,余数为1的告警信息分配在第二告警处理器中,以此类推,将余数为m-1的告警信息分配在第m告警处理器中。步骤D)中的第1)步所述的使用资源缓存匹配告警对象,是根据告警设备的标识,从资源缓存中调取对应设备的基本信息,包括:设备的名称,设备的ip,以及设备的型号。步骤D)中的第2)步所述的告警处理器处理告警信息包括:(1)判断告警信息是否需要发送短信,是进入第(2)步,否则进入第(3)步;(2)写任务到短信通知任务队列;(3)判断是否发送邮件,是进入第(4)步,否则进入第(5)步;(4)写任务到邮件通知任务队列;(5)写任务到告警入库任务队列。步骤D)中的第2)步所述的短信处理者、邮件处理者、告警入库处理者分别作为观察者随时监听各自的任务队列是否有任务需要执行,有任务则立即执行。本专利技术的一种低延迟的告警解析处理方法,能够解决快速解析并处理多个不同来源的系统告警信息,尤其能够在大量实时数据从各个途径、来源地涌向中央数据中心时候,alarmserver(告警服务器)能够快速的并发解析数据、根据规则处理数据,最终入库或者广播。使用内存缓存降级于数据库的交互(降低网络和IO的瓶颈)、使用队列加快告警服务与外部接口的交互(数据库、邮件服务器、短信网关)。本专利技术能够实现告警解析处理的有序并发,使用缓存机制实现告警信息和告警设备的低延迟解析,实现告警主流程任务,可广泛应用于类似系统信息的收集和集中处理。附图说明图1是本专利技术派发器派发告警信息的流程图;图2是本专利技术告警处理器的工作示意图;图3是本专利技术告警处理器的工作流程图;图4是本专利技术低延迟的告警解析处理方法的流程图。具体实施方式下面结合实施例和附图对本专利技术的一种低延迟的告警解析处理方法做出详细说明。本专利技术的一种低延迟的告警解析处理方法,是运用在网管系统的范畴内,包括如下步骤:A)各采集机与被网管的设备通过网络通信,收集被管理设备发生故障时产生的告警信息,并统一告警信息的格式;所述的告警信息包括:故障名称、故障原因、故障设备的编号、故障等级以及发生故障的时间,所述的故障等级包括:紧急、主要、次要、警告。告警信息格式采用标准的JSON格式,如表2所示:表2本专利技术中所述的统一告警信息的格式,包括:1)初始化,并接收Trap数据包;所述的初始化包括:将告警定义表的数据加载到内存,加载所有支持的特殊解析所用到的动态库和函数,形成包含动态库名、函数名和函数指针的动态库链表,加载映射策略到内存中,形成包含映射策略名和映射名值对列表的映射策略链表,以及启动Trap数据包的循环收取功能;2)将2进制的Trap数据包解析成文本格式,并根据Trap数据中的Trap的OID查询告警定义表,查询到相应的数据,用来进行后面步骤;所述的查询包括:检查记录的告警解析类型,当告警解析类型为非0,进入变量解析流程;为0,则根据Trap名称字段存储的变量序号,在Trap数据包包含的变量组中找到相应序号的变量值,拼组出新的Trap的OID,然后根据新的OID,查找告警定义表,找到这个OID对应的定义表记录,包括:告警名称、设备标识、告警类型、Trap类型、告警级别、告警对象、告警描述、关键变量、映射策略和动态库配置;3)根据第2)步查询出的告警名称、设备标识、告警类型、Trap类型、告警级别、告警对象、告警描述和关键变量字段的配置,从Trap数据包的变量组中提取相应的数据,完成对字段的解析和本文档来自技高网...
一种低延迟的告警解析处理方法

【技术保护点】
一种低延迟的告警解析处理方法,是运用在网管系统的范畴内,包括如下步骤:A)各采集机与被网管的设备通过网络通信,收集被管理设备发生故障时产生的告警信息,并统一告警信息的格式;B)告警服务器和存储设备详细信息的数据库通过网络通信,其中,告警服务器能够缓存设备的详细信息,并定时更新缓存;C)各采集机通过网络通信向告警服务器上报告警信息,告警服务器中的告警接收器收集告警信息,并转交给告警派发器,告警派发器按照分发原则将告警信息分发到相应的告警处理器中;D)告警处理器使用缓存对告警信息进行解析,以及对告警信息的处理任务进行派发,所述的对告警信息进行解析,包括如下步:1)告警处理器解析告警信息,即使用资源缓存匹配告警对象;2)告警处理器处理告警信息,将告警信息和告警设备的详细信息分别派发到对应短信通知任务队列的短信处理者、对应邮件通知任务队列的邮件处理者、以及对应用于存入数据库的告警入库任务队列的告警入库处理者。

【技术特征摘要】
1.一种低延迟的告警解析处理方法,是运用在网管系统的范畴内,包括如下步骤:
A)各采集机与被网管的设备通过网络通信,收集被管理设备发生故障时产生的告警信
息,并统一告警信息的格式;
B)告警服务器和存储设备详细信息的数据库通过网络通信,其中,告警服务器能够缓
存设备的详细信息,并定时更新缓存;
C)各采集机通过网络通信向告警服务器上报告警信息,告警服务器中的告警接收器收
集告警信息,并转交给告警派发器,告警派发器按照分发原则将告警信息分发到相应的告警
处理器中;
D)告警处理器使用缓存对告警信息进行解析,以及对告警信息的处理任务进行派发,
所述的对告警信息进行解析,包括如下步:
1)告警处理器解析告警信息,即使用资源缓存匹配告警对象;
2)告警处理器处理告警信息,将告警信息和告警设备的详细信息分别派发到对应短信
通知任务队列的短信处理者、对应邮件通知任务队列的邮件处理者、以及对应用于存入数据
库的告警入库任务队列的告警入库处理者。
2.根据权利要求1所述的一种低延迟的告警解析处理方法,其特征在于,步骤A)所
述的告警信息包括:故障名称、故障原因、故障设备的编号、故障等级以及发生故障的时间。
3.根据权利要求2所述的一种低延迟的告警解析处理方法,其特征在于,所述的故障
等级包括:紧急、主要、次要、警告。
4.根据权利要求1所述的一种低延迟的告警解析处理方法,其特征在于,步骤B)中
所述的定时更新缓存,是指告警服务器的资源缓存每隔设定的时间扫描数据库内被管设备数
据是否发生更新...

【专利技术属性】
技术研发人员:马腾俞力杰
申请(专利权)人:北京英诺威尔科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1