The embodiment of the invention discloses a method and device for analyzing the stability of the system, which relates to the field of computer technology and can improve the intelligence degree and accuracy of the stability of the monitoring system. The invention comprises: collecting the operation data associated with the monitoring index, selecting the operation data to be processed from the collected operation data by utilizing the correlation between different monitoring indexes, and determining the fluctuation range, and obtaining the abnormal situation of the current operation data of the system according to the fluctuation range. It is used to analyze the stability of the system.
【技术实现步骤摘要】
一种分析系统稳定性的方法及装置
本专利技术涉及计算机
,尤其涉及一种分析系统稳定性的方法及装置。
技术介绍
随着计算机技术和互联网技术的发展,中国的互联网产业的规模不断膨胀,大量的在线业务被不断地设计出来,为了保证这些在线业务正常运行,需要实时这些业务所在系统的运行状况目前,绝大多数系统监控采用针对某项系统运行指标设定阀值,通过比较运行值与阀值的大小来判断系统运行状态是否正常,但是这种静态的设置监控指标的监控方式,只能够解决一些较粗粒度的指标监控,比如监控CPU的负载情况、网络端口的阻塞情况等指标的监控,仅能够判定系统是否超载。并且在实际应用中,监控的效果不够智能、灵活,目前的监控策略往往都存在监控场景单一、判定方式僵化的问题,尤其是对于很多复杂情景下的系统运行状况,难以做出正确的判定。而为了提高系统的稳定性,最常见的方式是为系统进行扩容。在新系统申请或扩容时,也会参考指标监控评估出所需机器配置与数量。但是由于这些指标监控的阀值,往往又是根据人的经验确定,受个人经验影响,很不准确。
技术实现思路
本专利技术的实施例提供一种分析系统稳定性的方法及装置,能够提高监控系统稳定性的智能化程度和准确度。在目前已有的技术中通常是通过一些人为直接设定的指标来监控系统异常,往往受个人经验影响,较粗粒度的指标监控也已经难以保障系统监控的准确度。监控的准确度较低直接导致了系统扩容后往往都还需要调试系统,前后调试系统也需要很多时间。监控的准确度较低,也导致了在系统调试后,在线业务都很容易出现一些运行故障、事故,这就有需要分配相应的人力进行故障排查,从而增加了运营商的经营成本, ...
【技术保护点】
1.一种分析系统稳定性的方法,其特征在于,包括:采集与监控指标关联的运行数据;利用不同的监控指标之间的相关性,从所采集的运行数据中选择待处理的运行数据,并确定波动范围,其中,待处理的运行数据包括:N组运行数据,且在所述N组运行数据中至少存在一对具有相关性的监控指标,即第i组运行数据关联的监控指标与第j组运行数据关联的监控指标存在相关性,N≥2,1≤i≤N、1≤j≤N且i≠j;根据所述波动范围,获取系统当前的运行数据的异常情况。
【技术特征摘要】
1.一种分析系统稳定性的方法,其特征在于,包括:采集与监控指标关联的运行数据;利用不同的监控指标之间的相关性,从所采集的运行数据中选择待处理的运行数据,并确定波动范围,其中,待处理的运行数据包括:N组运行数据,且在所述N组运行数据中至少存在一对具有相关性的监控指标,即第i组运行数据关联的监控指标与第j组运行数据关联的监控指标存在相关性,N≥2,1≤i≤N、1≤j≤N且i≠j;根据所述波动范围,获取系统当前的运行数据的异常情况。2.根据权利要求1所述的方法,其特征在于,所述监控指标至少包括:处理器的空闲时间百分比、所述处理器的写入/读出等待时间百分比、所述处理器的用户程序占用时间百分比、内存使用百分比、磁盘读写端口的使用率、网卡发送的数据流量和所述网卡接受数据流量、所述系统的服务调用量、所述系统的响应时间、所述系统的业务异常量和所述系统的订单量中的至少一项。3.根据权利要求1或2所述的方法,其特征在于,所述利用不同的监控指标之间的相关性,从所采集的运行数据中选择待处理的运行数据,并确定波动范围,包括:建立所述待处理的运行数据的数据模型;通过所述数据模型确定相关系数的值,并设定所述相关系数的波动范围。4.根据权利要求3所述的方法,其特征在于,所述建立所述待处理的运行数据的数据模型,包括:采集至少两组不同的运行数据,并获取每两组不同的运行数据之间相关系数;若其中两组数据的相关系数大于预设值,则建立相关系数大于预设值的两组运行数据的数据模型。5.根据权利要求1所述的方法,其特征在于,所述根据所述波动范围,获取系统当前的运行数据的异常情况,包括:采集所述系统当前的运行数据,并通过所建立的数据模型输出所述系统当前的运行数据的计算结果;当所述计算结果不符合所述波动范围时,判定所述系统当前的运行数据的异常。6.根据权利要求1或5所述的方法,其特征在于,还包括:当判定所述系统当前的运行数据的异常时,提取异常信息,所述异常信息至少包括所述系统的主机ip地址、所述监控指标和对应发生异常的运行数据的接口信息;根据所述异常信息发出预警。7.根据权利要求6所述的方法,其特征在于...
【专利技术属性】
技术研发人员:孙迁,叶国华,刘发亮,马翔,杜中原,
申请(专利权)人:苏宁云商集团股份有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。