System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种智能化运维的报警聚敛方法及装置制造方法及图纸_技高网

一种智能化运维的报警聚敛方法及装置制造方法及图纸

技术编号:40004852 阅读:9 留言:0更新日期:2024-01-09 04:44
本申请提供一种智能化运维的报警聚敛方法及装置,涉及监控报警技术领域,所述方法包括:获取当前时刻的所有报警信息;从预先构建的队列的头部开始,依次判断队列中每个报警信息与当前时刻的每个报警信息是否匹配成功,若匹配成功,则删除当前时刻的报警信息,更新队列中匹配成功的报警信息的出现频次,根据队列中各报警信息的出现频次的大小重新对队列进行降序排列;若匹配失败,判断队列是否已满,若为是,对当前时刻的报警信息进行存储,否则,将当前时刻的报警信息放入队列的尾部。本申请可以有效地降低数据中心的网络带宽使用率和存储使用率。

【技术实现步骤摘要】

本申请涉及监控报警,尤其是涉及一种智能化运维的报警聚敛方法及装置


技术介绍

1、目前,报警收敛已经成为了监控报警领域面临的一个重要问题。通用的策略是分析报警内容,按照相同关键字进行报警合并。这种策略在具体应用上未达到预期效果,原因在于很多关联报警的内容本身并不包含相同关键字。

2、为了解决上述问题,演化出了两种合并聚类策略:

3、第一种是分维度报警合并策略,即按照报警维度属性(机房、机器、实例、服务等)合并。

4、第二种是基于关联挖掘的合并策略,即采用离线数据挖掘或机器学习的方式,从历史报警中挖掘出具有关联关系的监控策略,然后将相关联监控策略下的报警进行合并。

5、当发生报警泛滥时,上述的合并策略会导致太多相似的报警信息存储到存储器中,导致整个运维系统需要较大的存储量和网络传输量。


技术实现思路

1、有鉴于此,本申请提供了一种智能化运维的报警聚敛方法及装置,以解决上述技术问题。

2、第一方面,本申请实施例提供了一种智能化运维的报警聚敛方法,包括:

3、获取当前时刻的所有报警信息;

4、从预先构建的队列的头部开始,依次判断队列中每个报警信息与当前时刻的每个报警信息是否匹配成功;

5、若匹配成功,则删除当前时刻的报警信息,更新队列中匹配成功的报警信息的出现频次,根据队列中各报警信息的出现频次的大小重新对队列进行降序排列;

6、若匹配失败,判断队列是否已满,若为是,对当前时刻的报警信息进行存储,否则,将当前时刻的报警信息放入队列的尾部。

7、进一步地,从预先构建的队列的头部开始,依次判断队列中每个报警信息与当前时刻的每个报警信息是否匹配成功,包括:

8、步骤s1:提取当前时刻的报警信息的关键特征,生成当前时刻的报警信息的特征向量;

9、步骤s2:获取队列的第i个报警信息的特征向量,其中,i的初始值为1;

10、步骤s3:计算当前时刻的报警信息的特征向量和队列的第i个报警信息的特征向量的相似度值;

11、步骤s4:判断相似度值是否大于当前时刻的动态阈值,若为是,则当前时刻的报警信息和队列的第i个报警信息匹配成功,匹配结束;否则,进入步骤s5;

12、步骤s5:判断i+1是否大于l,l为队列的长度,若为是,则判断当前时刻的报警信息匹配不成功,否则,将i的值增加1后转入步骤s2。

13、进一步地,报警信息的关键特征包括:区域,机房,环境,异常源和事件;提取当前时刻的报警信息的关键特征,生成当前时刻的报警信息的特征向量,包括:

14、获取当前时刻的报警信息中的结构化信息和报警日志文本;

15、从结构化信息中提取区域、机房、环境和异常来源;所述环境为内网区域、外网区域或dmz区域;所述异常来源为存储节点、计算节点或管理节点;

16、采用基于最长公共子序列的在线日志解析方法,从报警日志文本解析出日志模板,将每个日志模板作为事件;

17、使用预先设置的代表不同区域的数字,代表不同机房的数字,代表不同环境的数字以及代表不同异常源的数字,对提取出的区域,机房,环境和异常源进行数值化,得到区域数值b1,机房数值b2,环境数值b3和异常源数值b4;

18、采用tf-idf算法和预设的语料库,对提取的事件进行量化,得到事件数值b5;

19、生成当前时刻的报警信息的特征向量b:b=(b1,b2,b3,b4,b5)。

20、进一步地,计算当前时刻的报警信息的特征向量和队列的第i个报警信息的特征向量的相似度值;包括:

21、队列的第i个报警信息的特征向量ai表示为:

22、ai=(ai,1,ai,2,ai,3,ai,4,ai,5)

23、其中,ai,1为第i个报警信息的区域数值,ai,2为第i个报警信息的机房数值,ai,3为第i个报警信息的环境数值,ai,4为第i个报警信息的异常源数值,ai,5为第i个报警信息的事件数值;

24、计算特征向量b和特征向量ai的余弦值cosθi:

25、

26、将余弦值cosθi作为特征向量b和特征向量ai的相似度值。

27、进一步地,所述方法还包括:计算当前时刻的动态阈值:

28、

29、其中,t表示当前时刻,tt为当前时刻的动态阈值,t0为初始阈值,lt为当前时刻的队列的空置长度。

30、进一步地,所述方法还包括:

31、生成大小为l的队列,当接收到首个报警信息,提取报警信息的关键特征,生成报警信息的特征向量,将报警信息的特征向量放入队列的头部,并设置报警信息的出现频次为1。

32、进一步地,所述方法还包括:

33、从队列的头部获取报警信息,将其发送到告警通知器;

34、将队列的第二个报警信息作为队列的头部;

35、获取存储的未处理的报警信息,放入队列的尾部。

36、第二方面,本申请实施例提供一种智能化运维的报警聚敛装置,包括:

37、获取单元,用于获取当前时刻的所有报警信息;

38、匹配单元,用于从预先构建的队列的头部开始,依次判断队列中每个报警信息与当前时刻的每个报警信息是否匹配成功,若匹配成功,进入第一处理单元,若匹配失败,进入第二处理单元;

39、第一处理单元,用于删除当前时刻的报警信息,更新队列中匹配成功的报警信息的出现频次,根据队列中各报警信息的出现频次的大小重新对队列进行降序排列;

40、第二处理单元,用于判断队列是否已满,若为是,对当前时刻的报警信息进行存储,否则,将当前时刻的报警信息放入队列的尾部。

41、第三方面,本申请实施例提供一种电子设备,包括:存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例的方法。

42、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令被处理器执行时实现如本申请实施例的方法。

43、本申请可以有效地降低数据中心的网络带宽使用率和存储使用率。

本文档来自技高网...

【技术保护点】

1.一种智能化运维的报警聚敛方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,从预先构建的队列的头部开始,依次判断队列中每个报警信息与当前时刻的每个报警信息是否匹配成功,包括:

3.根据权利要求2所述的方法,其特征在于,报警信息的关键特征包括:区域,机房,环境,异常源和事件;提取当前时刻的报警信息的关键特征,生成当前时刻的报警信息的特征向量,包括:

4.根据权利要求3所述的方法,其特征在于,计算当前时刻的报警信息的特征向量和队列的第i个报警信息的特征向量的相似度值;包括:

5.根据权利要求3所述的方法,其特征在于,所述方法还包括:计算当前时刻的动态阈值:

6.根据权利要求2所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.一种智能化运维的报警聚敛装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被处理器执行时实现如权利要求1-7任一项所述的方法。

...

【技术特征摘要】

1.一种智能化运维的报警聚敛方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,从预先构建的队列的头部开始,依次判断队列中每个报警信息与当前时刻的每个报警信息是否匹配成功,包括:

3.根据权利要求2所述的方法,其特征在于,报警信息的关键特征包括:区域,机房,环境,异常源和事件;提取当前时刻的报警信息的关键特征,生成当前时刻的报警信息的特征向量,包括:

4.根据权利要求3所述的方法,其特征在于,计算当前时刻的报警信息的特征向量和队列的第i个报警信息的特征向量的相似度值;包括:

5.根据权利要求3所述的方法,其特征在于,所述方法...

【专利技术属性】
技术研发人员:李映江杨馥铭覃力更潘华胡红波
申请(专利权)人:广西北投信创科技投资集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1