This specification discloses an alarm threshold setting method, which includes: acquiring time series data stored in the monitoring system for monitoring target monitoring indicators in the server, storing the first historical monitoring data of the target monitoring indicators in the time series data, and extracting the first historical monitoring data from the time series data. By using machine learning model, the first historical monitoring data are analyzed and the alarm threshold of the target monitoring index is obtained at different time points and/or different time periods. The machine learning model is based on the training of preset training samples, which contain the target monitoring index at different time points and/or different time periods. The second historical monitoring data and the ideal alarm threshold corresponding to each time point or period. At the same time, the instruction also discloses a setting device of alarm threshold.
【技术实现步骤摘要】
一种报警阈值的设置方法及装置
本说明书涉及互联网
,尤其涉及一种报警阈值的设置方法及装置。
技术介绍
为了保证服务器的正常运行,需要对服务器上的各种运行数据进行实时监测,由此,专用的服务器监测系统应运而生。例如,Xflush,是“蚂蚁金服”用于线上监测的一个系统,其可以监测服务器上的多种运行数据(例如:CPU使用率、硬盘使用率、等等),针对不同的运行数据,还可以设置不同报警阈值,若某一运行数据达到其报警阈值,则进行报警。目前在设置报警阈值时,主要是由人工设置,但是这种方式严重依赖设置人员的经验,若人员经验不足,容易出现设置的报警阈值不合理的情况(例如:设置的报警阈值过低或者过高,或者,针对某些特定业务,始终使用同一个报警阈值)。
技术实现思路
本申请实施例通过提供一种报警阈值的设置方法及装置,解决了现有技术中在对监测系统设置报警阈值时,存在设置的报警阈值不准确或不合理,导致监测系统的监测效果较差的技术问题,实现了提高监测系统中报警阈值的准确性及合理性,提高监测系统的监测效果的技术效果。第一方面,本申请通过本申请的一实施例提供如下技术方案:一种报警阈值的设置方法,包括:获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;从所述时间序列数据中提取所述第一历史监测数据;利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在 ...
【技术保护点】
1.一种报警阈值的设置方法,包括:获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;从所述时间序列数据中提取所述第一历史监测数据;利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在不同时间点和/或不同间时段的第二历史监测数据、以及每个时间点或每个时间段对应的理想报警阈值。
【技术特征摘要】
1.一种报警阈值的设置方法,包括:获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间序列数据中存储有所述目标监测指标的第一历史监测数据;从所述时间序列数据中提取所述第一历史监测数据;利用机器学习模型,对所述第一历史监测数据进行分析,获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值;其中,所述机器学习模型是基于预设训练样本训练得到的,所述预设训练样本中包含所述目标监测指标在不同时间点和/或不同间时段的第二历史监测数据、以及每个时间点或每个时间段对应的理想报警阈值。2.如权利要求1所述的报警阈值的设置方法,在所述获得所述目标监测指标在不同时间点和/或不同时间段内的报警阈值之后,还包括:基于所述报警阈值对所述目标监测指标进行监测。3.如权利要求2所述的报警阈值的设置方法,在所述基于所述报警阈值对所述目标监测指标进行监测之前,还包括:将所述报警阈值发送给预设终端设备,以使得所述预设终端设备对应的预设用户对所述报警阈值进行修正;接收所述预设终端设备反馈的修正后的所述报警阈值;此时,所述基于所述报警阈值对所述目标监测指标进行监测,包括:基于修正后的所述报警阈值对所述目标监测指标进行监测。4.如权利要求2所述的报警阈值的设置方法,所述基于所述报警阈值对所述目标监测指标进行监测,包括:对所述目标监测指标的监测值进行可视化处理,生成可视化图表,并输出所述可视化图表。5.如权利要求1所述的报警阈值的设置方法,所述基于所述报警阈值对所述目标监测指标进行监测,包括:若发现所述目标监测指标的监测值达到所述报警阈值时,则采取应急响应措施。6.如权利要求5所述的报警阈值的设置方法,所述采取应急响应措施,包括以下措施中的一种或多种:对所述服务器的访问流量进行限制;暂停所述服务器执行第一预设程序代码;启动所述服务器执行第二预设程序代码;输出报警信息。7.如权利要求1~6任一所述的报警阈值的设置方法,所述基于所述报警阈值对所述目标监测指标进行监测,包括:对所述目标监测指标的监测值进行预测;当预测到所述目标监测指标的监测值在未来的某一时间点将达到所述报警阈值时,在所述时间点到来前,对所述服务器中的数据库缓存进行扩容处理。8.如权利要求7所述的报警阈值的设置方法,在所述对所述服务器中数据库的缓存进行扩容处理之后,还包括:在监测到所述目标监测指标的监测值恢复正常时,对所述数据库缓存进行缩容处理。9.一种报警阈值的设置装置,包括:获取单元,用于获取监测系统中存储的时间序列数据,所述监测系统用于对服务器中的目标监测指标进行监测,所述时间...
【专利技术属性】
技术研发人员:岳远泽,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。