异常告警方法和装置制造方法及图纸

技术编号:35016850 阅读:16 留言:0更新日期:2022-09-21 15:21
本说明书实施例提供了一种异常告警的方法及装置。该方法中,在每一个采样周期均执行:对业务应用关联的监控指标的值进行采样;判断在当前采样周期采样到的当前监控指标值是否大于预先设置的指标阈值;如果大于,则得到N个数组;其中,该N个数组包括:由当前采样周期对应的时间点以及当前监控指标值组成的一个数组,以及在当前采样周期之前和/或之后的N

【技术实现步骤摘要】
异常告警方法和装置


[0001]本说明书一个或多个实施例涉及网络通信技术,尤其涉及异常告警方法和装置。

技术介绍

[0002]随着互联网的发展,出现了海量的业务应用,为了保证各种业务应用的正常运行,需要对业务应用的运行情况进行监控,当发现监控指标存在异常时进行告警。
[0003]目前,进行异常告警的方法主要包括:在业务运行过程中,采集监控指标,判断采集到的监控指标的值是否大于预先设置的指标阈值,如果大于,则确定出现了异常征兆,进行告警。比如,目前出现了面向切面编程(AOP)技术,通过业务应用的切点在业务应用的程序中注入切面程序,基于切面安全技术来实现对应业务应用的各种功能,比如监控业务应用的运行过程中是否出现了隐私数据的泄露。而切面程序的注入可能会导致业务应用的运行出现异常,因此,需要进行异常告警。
[0004]然而,目前的异常告警方法在采集到的监控指标值大于指标阈值时就认为出现了异常征兆,往往会导致误判,从而进行错误的告警处理。

技术实现思路

[0005]本说明书一个或多个实施例描述了异常告警方法和装置,能够更加准确地进行异常告警。
[0006]根据第一方面,提供了一种异常告警方法,其中,该方法在每一个采样周期均执行:对监控指标的值进行采样;判断在当前采样周期采样到的当前监控指标值是否大于预先设置的指标阈值;如果大于,则得到N个数组;其中,N为大于1的整数,该N个数组包括:由当前采样周期对应的时间点以及当前监控指标值组成的一个数组,以及在当前采样周期之前和/或之后的共N/>‑
1个采样周期对应的时间点以及对应的监控指标值组成的N

1个数组;对所述N个数组进行曲线拟合,得到拟合后的曲线的参数;根据拟合后的曲线的参数确定是否进行异常告警。
[0007]其中,所述监控指标包括如下中的任意一种:针对业务应用所注入的切面的监控指标;针对业务应用提供的一项服务的监控指标;针对操作系统层面的监控指标;针对JAVA虚拟机的监控指标。
[0008]其中,所述对N个数组进行曲线拟合得到拟合后的曲线的参数,包括:对所述N个数组进行指数函数形式的曲线拟合;其中,表征该曲线的指数函数的表达式为:;其中,y对应监控指标值,x
对应采样周期的时间点,a、b分别为指数函数的参数;得到拟合后的曲线的参数b的值。
[0009]其中,所述根据拟合后的曲线的参数确定是否进行异常告警,包括:判断得到的参数b的值是否大于预先设置的参数阈值B1;其中,B1表征的是对监控指标值处于高位时所持续的采样周期的数量的容忍度;如果大于,则确定进行异常告警,否则,不进行异常告警。
[0010]其中,在判断出参数b的值大于预先设置的B1之后,并在确定进行异常告警之前,进一步包括:计算所述N个数组中的N个监控指标值的中位数或平均值;判断计算出的中位数或平均值是否大于所述指标阈值,如果是,则进行异常告警,并将该N个监控指标值作为监控异常数据提供给外部。
[0011]在判断出参数b的值大于预先设置的B1之后,该方法进一步包括:判断得到的参数b的值是否大于预先设置的B2;B2大于B1;如果参数b的值大于预先设置的B2,则确定当前出现了监控指标值处于持续高位的异常征兆;如果参数b的值小于B2且大于B1,则确定当前出现了监控指标值处于短暂高位的异常征兆。
[0012]在进行异常告警之后,进一步包括:根据切面业务模块、切面业务模块所在的业务应用、业务应用所在的机器、机器所在的机房中的至少两个维度,得到至少两个视角的监控异常数据;根据该至少两个视角的监控异常数据以及相应维度的日志,综合判断当前是否需要进行故障应急处理,如果是,则进行对应维度的故障应急处理。
[0013]其中,当所述维度包括切面业务模块的维度时,所述故障应急处理包括:关闭切面业务模块中引起监控异常的切点;和/或,当所述维度包括切面业务模块所在的业务应用的维度时,所述故障应急处理包括:关闭业务应用的功能;和/或,当所述维度包括业务应用所在的机器/机房时,所述故障应急处理包括:将该机器/机房所处理的业务引流到其他机器/机房、重启机器/机房、卸载机器/机房中的业务应用、升级机器/机房中的业务应用中的至少一项。
[0014]根据第二方面,提供了异常告警装置,其中,包括:监控指标值采集模块,配置为在每一个采样周期中对业务应用关联的监控指标的值进行采样;启动模块,配置为判断在当前采样周期采样到的当前监控指标值是否大于预先设置的指标阈值;如果大于,则触发曲线拟合模块;曲线拟合模块,配置为得到N个数组;其中,该N个数组包括:由当前采样周期对应的时间点以及当前监控指标值组成的一个数组,以及在当前采样周期之前和/或之后的N

1个采样周期对应的时间点以及对应的监控指标值组成的N

1数组;对N个数组进行曲线
拟合,得到拟合后的曲线的参数;告警模块,配置为根据拟合后的曲线的参数确定是否进行异常告警。
[0015]根据第三方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书任一实施例所述的方法。
[0016]本说明书各个实施例提供的异常告警方法及装置,至少能够达到如下的有益效果:1、能够更加准确地进行异常告警,减少误报。比如,能够区分监控指标值的异常升高是否属于“毛刺”类型的异常情况,从而过滤掉毛刺类型,针对此种异常升高,不进行异常告警,减少了告警量,并减少了误报。
[0017]2、采用数学手段的方法即基于曲线拟合的方法,而非统计学方法,效率更高,计算量小,可以满足海量业务的异常告警的实时性要求。
[0018]3、在告警时,能够进一步提供异常类型,比如为监控指标值持续高位的异常类型或者监控指标值短暂高位的异常类型,从而丰富了告警内容,更加有利于故障排查。
附图说明
[0019]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是多个采样周期内采样到的各监控指标值形成的毛刺类型的曲线图的示意图。
[0021]图2是本说明书一个实施例中异常告警的方法的流程图。
[0022]图3是多个采样周期内采样到的各监控指标值形成的持续高位类型的曲线图的示意图。
[0023]图4是多个采样周期内采样到的各监控指标值形成的短暂高位类型的曲线图的示意图。
[0024]图5是多个采样周期内采样到的各监控指标值形成的抖动类型的曲线图的示意图。
[0025]图6是本说明书另一个实施例中的异常告警方法的流程图。
[0026]图7是本说明书一个实施例中异常告警装置的结构示意图。
[0027]图8是本说明书另一个实施例中异常告警装本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.异常告警方法,其中,该方法在每一个采样周期均执行:对监控指标的值进行采样;判断在当前采样周期采样到的当前监控指标值是否大于预先设置的指标阈值;如果大于,则得到N个数组;其中,N为大于1的整数,该N个数组包括:由当前采样周期对应的时间点以及当前监控指标值组成的一个数组,以及在当前采样周期之前和/或之后的共N

1个采样周期对应的时间点以及对应的监控指标值组成的N

1个数组;对所述N个数组进行曲线拟合,得到拟合后的曲线的参数;根据拟合后的曲线的参数确定是否进行异常告警。2.根据权利要求1所述的方法,其中,所述监控指标包括如下中的任意一种:针对业务应用所注入的切面的监控指标;针对业务应用提供的一项服务的监控指标;针对操作系统层面的监控指标;针对JAVA虚拟机的监控指标。3.根据权利要求1所述的方法,其中,所述对N个数组进行曲线拟合得到拟合后的曲线的参数,包括:对所述N个数组进行指数函数形式的曲线拟合;其中,表征该曲线的指数函数的表达式为:;其中,y对应监控指标值,x对应采样周期的时间点,a、b分别为指数函数的参数;得到拟合后的曲线的参数b的值。4.根据权利要求3所述的方法,其中,所述根据拟合后的曲线的参数确定是否进行异常告警,包括:判断得到的参数b的值是否大于预先设置的参数阈值B1;其中,B1表征的是对监控指标值处于高位时所持续的采样周期的数量的容忍度;如果大于,则确定进行异常告警,否则,不进行异常告警。5.根据权利要求4所述的方法,其中,在判断出参数b的值大于预先设置的B1之后,并在确定进行异常告警之前,进一步包括:计算所述N个数组中的N个监控指标值的中位数或平均值;判断计算出的中位数或平均值是否大于所述指标阈值,如果是,则进行异常告警,并将该N个监控指标值作为监控异常数据提供给外部。6.根据权利要求4所述的方法,在判断出参数b的值大于预先设置的B1之后,该方法进一步包括:判断得到的参数b的值是否大于预先设置的B2;B2大于B1;如果参数b的值大于预...

【专利技术属性】
技术研发人员:张锐
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1