一种设备告警信息分类并预警的方法、系统、设备和介质技术方案

技术编号:38668177 阅读:16 留言:0更新日期:2023-09-02 22:47
本发明专利技术提供一种设备告警信息分类并预警的方法、系统、设备和存储介质,方法包括:对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及响应于所述概率大于阈值,向运维人员发送第二告警信息。本发明专利技术通过消息队列区分告警和事件,缩短了处理告警上报的时间,并且通过预定算法(例如决策树算法),对事件进行分析,预测设备可能出现的异常状态,向运维人员提前发出预警。向运维人员提前发出预警。向运维人员提前发出预警。

【技术实现步骤摘要】
一种设备告警信息分类并预警的方法、系统、设备和介质


[0001]本专利技术涉及设备监控领域,更具体地,特别是指一种设备告警信息分类并预警的方法、系统、设备和存储介质。

技术介绍

[0002]服务器、交换机等网络设备作为信息的载体,也发挥着重要的作用。这些设备作为网络的节点,存储、处理网络上80%的数据、信息,也被称为网络的灵魂。当网络设备发生故障或某些原因导致系统处于不正常的工作状态时,系统能够根据不同类型及不同模块出现的故障产生告警信息,同时生成日志信息。这些告警信息按照对系统的影响又可分为:事件和告警。事件是指系统正常运行时记录下来的关键事件,一般对系统没有影响。告警是指可能影响系统的正常运行的故障。
[0003]常规的监控网络设备的手段分为主动和被动两种:
[0004]主动的监控手段如通过IPMI、REDFISH或SNMP等协议获取设备数据,并通过设定的阈值来判断设备当前是否处于健康状态,如通过IPMI命令来获取设备的主板温度,如果超过设定的阈值,如30摄氏度,就向监控人员发出报警信息;被动的监控手段一般采用SNMP Trap的方式来接收设备侧主动发出的告警信息,从而向监控人员发出报警,此种方式需要预先在设备侧配置trap主机,指定接受告警的主机,一般设置为监控平台所在的主机。当设备侧产生告警信息,则BMC会主动向监控平台推送Trap告警。
[0005]一般管理平台会着重处理设备的告警类信息,往往忽略了事件类告警。

技术实现思路

[0006]有鉴于此,本专利技术实施例的目的在于提出一种设备告警信息分类并预警的方法、系统、电子设备及计算机可读存储介质,本专利技术实施例通过消息队列区分告警和事件,缩短了处理告警上报的时间,并且通过预定算法(例如决策树算法),对事件进行分析,预测设备可能出现的异常状态,向运维人员提前发出预警,保证设备的安全性,并且,当设备发生海量数据后,本专利技术实施例通过将告警和事件以解析的方式分离,保证告警及时发送到运维人员手中,以供运维人员定位和分析问题根因,加快故障解决速度,降低因设备故障导致的损失。
[0007]基于上述目的,本专利技术实施例的一方面提供了一种设备告警信息分类并预警的方法,包括如下步骤:对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及响应于所述概率大于阈值,向运维人员发送第二告警信息。
[0008]在一些实施方式中,所述将所述原始告警信息分类为事件信息和第一告警信息包括:通过结构化搜索、全文搜索、多字段搜索、近似匹配和部分匹配对所述原始告警信息进行解析以将所述原始告警信息分类为事件信息和第一告警信息。
[0009]在一些实施方式中,所述将所述事件信息写入消息队列包括:实时检测事件信息的流量,并将事件信息的流量中大于第二阈值的部分推迟到下一时刻进入消息队列。
[0010]在一些实施方式中,所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:统计预设时间内同一设备发生事件及产生告警的情况以对同种类型的告警进行预测。
[0011]在一些实施方式中,所述预定算法包括决策树算法,并且所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:计算每个事件的信息增益,并根据信息增益将事件生成决策树。
[0012]在一些实施方式中,所述计算每个事件的信息增益包括:计算每个事件的信息熵,计算以每个事件为特征的熵,并用事件的信息熵和以事件为特征的熵的差值作为每个事件的信息增益。
[0013]在一些实施方式中,所述根据信息增益将事件生成决策树包括:将最大信息增益的事件作为根节点以生成决策树。
[0014]本专利技术实施例的另一方面,提供了一种设备告警信息分类并预警的系统,包括:采集模块,用于对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;写入模块,用于将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;分析模块,用于定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及告警模块,用于响应于所述概率大于阈值,向运维人员发送第二告警信息。
[0015]本专利技术实施例的又一方面,还提供了一种电子设备,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现如上方法的步骤。
[0016]本专利技术实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
[0017]本专利技术具有以下有益技术效果:通过消息队列区分告警和事件,缩短了处理告警上报的时间,并且通过预定算法(例如决策树算法),对事件进行分析,预测设备可能出现的异常状态,向运维人员提前发出预警,保证设备的安全性,并且,当设备发生海量数据后,通过将告警和事件以解析的方式分离,保证告警及时发送到运维人员手中,以供运维人员定位和分析问题根因,加快故障解决速度,降低因设备故障导致的损失。
附图说明
[0018]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0019]图1为本专利技术提供的设备告警信息分类并预警的方法的实施例的示意图;
[0020]图2为本专利技术提供的设备告警信息分类并预警的方法的流程图;
[0021]图3为本专利技术提供的决策树的架构图;
[0022]图4为本专利技术提供的设备告警信息分类并预警的系统的实施例的示意图;
[0023]图5为本专利技术提供的设备告警信息分类并预警的电子设备的实施例的硬件结构示意图;
[0024]图6为本专利技术提供的设备告警信息分类并预警的计算机存储介质的实施例的示意图。
具体实施方式
[0025]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。
[0026]需要说明的是,本专利技术实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本专利技术实施例的限定,后续实施例对此不再一一说明。
[0027]本专利技术实施例的第一个方面,提出了一种设备告警信息分类并预警的方法的实施例。图1示出的是本专利技术提供的设备告警信息分类并预警的方法的实施例的示意图。如图1所示,本专利技术实施例包括如下步骤:
[0028]S1、对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种设备告警信息分类并预警的方法,其特征在于,包括如下步骤:对设备的原始告警信息进行采集,并将所述原始告警信息分类为事件信息和第一告警信息;将所述第一告警信息直接发送给用户,并将所述事件信息写入消息队列;定时获取所述消息队列中的事件信息,并通过预定算法对所述事件信息进行分析以预测设备发生告警的概率;以及响应于所述概率大于阈值,向运维人员发送第二告警信息。2.根据权利要求1所述的设备告警信息分类并预警的方法,其特征在于,所述将所述原始告警信息分类为事件信息和第一告警信息包括:通过结构化搜索、全文搜索、多字段搜索、近似匹配和部分匹配对所述原始告警信息进行解析以将所述原始告警信息分类为事件信息和第一告警信息。3.根据权利要求1所述的设备告警信息分类并预警的方法,其特征在于,所述将所述事件信息写入消息队列包括:实时检测事件信息的流量,并将事件信息的流量中大于第二阈值的部分推迟到下一时刻进入消息队列。4.根据权利要求1所述的设备告警信息分类并预警的方法,其特征在于,所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:统计预设时间内同一设备发生事件及产生告警的情况以对同种类型的告警进行预测。5.根据权利要求1所述的设备告警信息分类并预警的方法,其特征在于,所述预定算法包括决策树算法,并且所述通过预定算法对所述事件信息进行分析以预测设备发生告警的概率包括:计算每个事件的信息增益,并根据...

【专利技术属性】
技术研发人员:郑坤
申请(专利权)人:济南浪潮数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1