一种报警阈值的设置方法及装置制造方法及图纸

技术编号:20796859 阅读:21 留言:0更新日期:2019-04-06 10:28
本说明书公开了一种报警阈值的设置方法,包括:获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;从所述时间序列数据中提取所述第一历史监测数据;利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在不同时间点和/或不同间时段的第二历史监测数据、以及每个时间点或每个时间段对应的理想报警阈值。同时,本说明书还公开了一种报警阈值的设置装置。

A Setting Method and Device of Alarm Threshold

This specification discloses an alarm threshold setting method, which includes: acquiring time series data stored in the monitoring system for monitoring target monitoring indicators in the server, storing the first historical monitoring data of the target monitoring indicators in the time series data, and extracting the first historical monitoring data from the time series data. By using machine learning model, the first historical monitoring data are analyzed and the alarm threshold of the target monitoring index is obtained at different time points and/or different time periods. The machine learning model is based on the training of preset training samples, which contain the target monitoring index at different time points and/or different time periods. The second historical monitoring data and the ideal alarm threshold corresponding to each time point or period. At the same time, the instruction also discloses a setting device of alarm threshold.

【技术实现步骤摘要】
一种报警阈值的设置方法及装置
本说明书涉及互联网
,尤其涉及一种报警阈值的设置方法及装置。
技术介绍
为了保证服务器的正常运行,需要对服务器上的各种运行数据进行实时监测,由此,专用的服务器监测系统应运而生。例如,Xflush,是“蚂蚁金服”用于线上监测的一个系统,其可以监测服务器上的多种运行数据(例如:CPU使用率、硬盘使用率、等等),针对不同的运行数据,还可以设置不同报警阈值,若某一运行数据达到其报警阈值,则进行报警。目前在设置报警阈值时,主要是由人工设置,但是这种方式严重依赖设置人员的经验,若人员经验不足,容易出现设置的报警阈值不合理的情况(例如:设置的报警阈值过低或者过高,或者,针对某些特定业务,始终使用同一个报警阈值)。
技术实现思路
本申请实施例通过提供一种报警阈值的设置方法及装置,解决了现有技术中在对监测系统设置报警阈值时,存在设置的报警阈值不准确或不合理,导致监测系统的监测效果较差的技术问题,实现了提高监测系统中报警阈值的准确性及合理性,提高监测系统的监测效果的技术效果。第一方面,本申请通过本申请的一实施例提供如下技术方案:一种报警阈值的设置方法,包括:获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;从所述时间序列数据中提取所述第一历史监测数据;利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在不同时间点和/或不同间时段的第二历史监测数据、以及每个时间点或每个时间段对应的理想报警阈值。第二方面,本申请通过本申请的一实施例,提供如下技术方案:一种报警阈值的设置装置,包括:获取单元,用于获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;提取单元,用于从所述时间序列数据中提取所述第一历史监测数据;分析单元,用于利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在不同时间点和/或不同间时段的第二历史监测数据、以及每个时间点或每个时间段对应的理想报警阈值。第三方面,本申请通过本申请的一实施例,提供如下技术方案:一种报警阈值的设置装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面中一种报警阈值的设置方法的任一方法步骤。第四方面,本申请通过本申请的一实施例,提供如下技术方案:一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中一种报警阈值的设置方法的任一方法步骤,。本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:在本申请实施例中,公开了一种报警阈值的设置方法,包括:获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;从所述时间序列数据中提取所述第一历史监测数据;利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在不同时间点和/或不同间时段的第二历史监测数据、以及每个时间点或每个时间段对应的理想报警阈值。由于利用机器学习模型,对第一历史监测数据进行分析,获得目标监测指标在不同时间点或不同时间段内的报警阈值,相比于现有技术中依赖人工经验,本实施例中可以提高设置报警阈值的准确性及合理性。故而解决了现有技术中在对监测系统设置报警阈值时,存在设置的报警阈值不准确或不合理,导致监测系统的监测效果较差的技术问题,实现了提高监测系统中报警阈值的准确性,使得监测系统可以进行更为细致的监测工作,降低出现误报或漏报的几率,提高监测系统的监测效果的技术效果。附图说明本申请实施例通过提供一种报警阈值的设置方法及装置,解决了现有技术中在对监测系统设置报警阈值时,存在设置的报警阈值不准确或不合理,导致监测系统的监测效果较差的技术问题,实现了提高监测系统中报警阈值的准确性及合理性,提高监测系统的监测效果的技术效果。图1为本说明书实施例中一种报警阈值的设置方法的流程图;图2为本说明书实施例中一种报警阈值的设置装置的结构图;图3为本说明书实施例中一种报警阈值的设置装置的结构图;图4为本说明书实施例中一种计算机可读存储介质的结构图。具体实施方式本申请实施例通过提供一种报警阈值的设置方法及装置,解决了现有技术中在对监测系统设置报警阈值时,存在设置的报警阈值不准确,导致监测系统的监测效果较差的技术问题,实现了提高监测系统中报警阈值的准确性,提高监测系统的监测效果的技术效果。本申请实施例的技术方案为解决上述技术问题,总体思路如下:一种报警阈值的设置方法,包括:获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;从所述时间序列数据中提取所述第一历史监测数据;利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在不同时间点和/或不同间时段的第二历史监测数据、以及每个时间点或每个时间段对应的理想报警阈值。为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。首先说明,本文中出现的术语“和/或”,仅仅是一种描述关联指标的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联指标是一种“或”的关系。实施例一本实施例提供了一种报警阈值的设置方法,应用于监测系统中,该监测系统用于对服务器上的运行的各种运行数据(例如:CPU使用率、硬盘使用率、各种业务的实时数据、等等)进行实时监测。在本文中,这些被监测的运行数据被统一称作“监测指标”。具体来讲,如图1所示,所述报警阈值的设置方法,包括:步骤S101:获取监测系统中存储的时间序列数据,监测系统用于对服务器中的目标监测指标进行监测,时间序列数据中存储有目标监测指标的第一历史监测数据。时间序列,是一组按照时间发生先后顺序进行排列的数据点序列。通常一组时间序列的时间间隔为一恒定值(如1秒、5分钟、12小时、7天、1年、等等),因此,时间序列可以作为离散时间数据进行分析处理。时间序列广泛应用于数理统计、信号处理、模式识别、计量经济学、数学金融、天气预报、地震预测、脑电图、控制工程、航空学、通信工程以及绝大多数涉及到时间数据测量的应用合理与工程学。在具体实施过程中,监测系统用于对服务器中的多项监测指标(本文档来自技高网...

【技术保护点】
1.一种报警阈值的设置方法,包括:获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;从所述时间序列数据中提取所述第一历史监测数据;利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在不同时间点和/或不同间时段的第二历史监测数据、以及每个时间点或每个时间段对应的理想报警阈值。

【技术特征摘要】
1.一种报警阈值的设置方法,包括:获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;从所述时间序列数据中提取所述第一历史监测数据;利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在不同时间点和/或不同间时段的第二历史监测数据、以及每个时间点或每个时间段对应的理想报警阈值。2.如权利要求1所述的报警阈值的设置方法,在所述获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值之后,还包括:基于所述报警阈值对所述目标监测指标进行监测。3.如权利要求2所述的报警阈值的设置方法,在所述基于所述报警阈值对所述目标监测指标进行监测之前,还包括:将所述报警阈值发送给预设终端设备,以使得所述预设终端设备对应的预设用户对所述报警阈值进行修正;接收所述预设终端设备反馈的修正后的所述报警阈值;此时,所述基于所述报警阈值对所述目标监测指标进行监测,包括:基于修正后的所述报警阈值对所述目标监测指标进行监测。4.如权利要求2所述的报警阈值的设置方法,所述基于所述报警阈值对所述目标监测指标进行监测,包括:对所述目标监测指标的监测值进行可视化处理,生成可视化图表,并输出所述可视化图表。5.如权利要求1所述的报警阈值的设置方法,所述基于所述报警阈值对所述目标监测指标进行监测,包括:若发现所述目标监测指标的监测值达到所述报警阈值时,则采取应急响应措施。6.如权利要求5所述的报警阈值的设置方法,所述采取应急响应措施,包括以下措施中的一种或多种:对所述服务器的访问流量进行限制;暂停所述服务器执行第一预设程序代码;启动所述服务器执行第二预设程序代码;输出报警信息。7.如权利要求1~6任一所述的报警阈值的设置方法,所述基于所述报警阈值对所述目标监测指标进行监测,包括:对所述目标监测指标的监测值进行预测;当预测到所述目标监测指标的监测值在未来的某一时间点将达到所述报警阈值时,在所述时间点到来前,对所述服务器中的数据库缓存进行扩容处理。8.如权利要求7所述的报警阈值的设置方法,在所述对所述服务器中数据库的缓存进行扩容处理之后,还包括:在监测到所述目标监测指标的监测值恢复正常时,对所述数据库缓存进行缩容处理。9.一种报警阈值的设置装置,包括:获取单元,用于获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间...

【专利技术属性】
技术研发人员:岳远泽
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1