异常设备的检测方法及装置制造方法及图纸

技术编号:21547679 阅读:18 留言:0更新日期:2019-07-06 21:19
本说明书一个或多个实施例提供一种异常设备的检测方法及装置,该方法可以包括:获取被监控系统的性能指标的实际数据;确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据;对所述第一实际数据进行评估得到第一评估结果、对所述第二实际数据进行评估得到第二评估结果;根据所述第一评估结果和所述第二评估结果确定所述被监控系统中的异常设备。

Detection Method and Device of Abnormal Equipment

【技术实现步骤摘要】
异常设备的检测方法及装置
本说明书一个或多个实施例涉及异常检测
,尤其涉及一种异常设备的检测方法及装置。
技术介绍
通过在数据中心等系统内配置告警机制,可以对系统内的被监控系统的运行状态进行监控,从而及时发现和解决被监控系统可能出现的异常状况。在相关技术中,通过采集系统内被监控系统的性能指标的数据(即性能数据),并将性能数据与预定义的性能阈值进行比较,可以在性能数据不符合性能阈值的情况下,判定相应的被监控系统可能存在异常。
技术实现思路
有鉴于此,本说明书一个或多个实施例提供一种异常设备的检测方法及装置。为实现上述目的,本说明书一个或多个实施例提供技术方案如下:根据本说明书一个或多个实施例的第一方面,提出了一种异常设备的检测方法,包括:获取被监控系统的性能指标的实际数据;确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据;对所述第一实际数据进行评估得到第一评估结果、对所述第二实际数据进行评估得到第二评估结果;根据所述第一评估结果和所述第二评估结果确定所述被监控系统中的异常设备。根据本说明书一个或多个实施例的第二方面,提出了一种异常设备的检测装置,包括:获取单元,获取被监控系统的性能指标的实际数据;确定单元,确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据;评估单元,对所述第一实际数据进行评估得到第一评估结果、对所述第二实际数据进行评估得到第二评估结果;识别单元,根据所述第一评估结果和所述第二评估结果确定所述被监控系统中的异常设备。附图说明图1是一示例性实施例提供的一种数据中心的结构示意图。图2是一示例性实施例提供的一种异常设备的检测方法的流程图。图3是一示例性实施例提供的一种告警系统针对数据中心实施异常检测的流程图。图4是一示例性实施例提供的一种性能指标X在三个运行周期内的历史数据的曲线示意图。图5是一示例性实施例提供的一种1分钟负载平均值、5分钟负载平均值和15分钟负载平均值的实际数据的曲线示意图。图6是一示例性实施例提供的一种经过Box-Cox变换算法处理后的1分钟负载平均值的实际数据的正态分布示意图。图7是一示例性实施例提供的一种电子设备的结构示意图。图8是一示例性实施例提供的一种异常设备的检测装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。图1是一示例性实施例提供的一种数据中心的结构示意图。如图1所示,在数据中心中配置有设备11、设备12、设备13等硬件设备以及告警系统14。其中,设备11-13等硬件设备通过独立或配合运行应用程序,以实现该数据中心的特定功能。告警系统14通过监测数据中心的性能指标,以确定该数据中心所处的运行状况。其中,该性能指标可以来自于设备11-13等硬件设备的硬件状态,也可以来自硬件设备上运行的应用程序的软件状态,或者还可以存在其他来源,本说明书并不对此进行限制。通过对性能指标进行监测,告警系统14可以及时发现数据中心内可能出现的异常设备,使得告警系统14可以向预设对象发出提示或告警,以便于及时诊断、分析或处理该异常情况,其中该预设对象可以包括数据中心的工作人员或自动化处理系统等,本说明书并不对此进行限制。在本说明书的实施例中,通过对告警系统14的异常检测方案予以优化和改进,可使监测操作更为准确、灵敏,避免对异常的误报而导致工作人员的人力资源或其他资源的浪费,确保数据中心的正常运行。其中,数据中心仅为本说明书中提供的异常检测方案的一种应用对象;实际上,除了数据中心之外,本说明书的异常检测方案还可以应用于其他任何电子设备、结构或系统,本说明书并不对此进行限制。图2是一示例性实施例提供的一种异常设备的检测方法的流程图。如图2所示,该方法可以包括以下步骤:步骤202,获取被监控系统的性能指标的实际数据。在一实施例中,性能指标可以包括用于反映被监控系统的运行状况的任意参数,比如吞吐量、事件计数、操作持续时间、内存或存储大小等,本说明书并不对此进行限制。在一实施例中,可以针对所述被监控系统的性能指标进行相关性分析;其中,当相关联的多个性能指标的实际数据均被获取时,可以筛除所述相关联的多个性能指标中至少一个性能指标的实际数据,而仅保留部分(一个或多个)性能指标的实际数据,据此减少后续过程中所需处理的数据量。举例而言,假定获取的实际数据对应的性能指标包括1分钟内的负载平均值、5分钟内的负载平均值、15分钟内的负载平均值,如果这三个性能指标之间相关联(例如关联程度大于预设程度),可以仅选用1分钟内的负载平均值对应的实际数据、筛除5分钟内的负载平均值和15分钟内的负载平均值对应的实际数据,从而仅需要针对1分钟内的负载平均值对应的实际数据进行处理,以降低后续步骤中的数据处理量,而不会对最终的评估结果等造成不良影响。在一实施例中,可以确定性能指标的实际数据是否满足预定义的标准数据结构,如果不满足则可以对实际数据进行调整、以使其满足于该标准数据结构。例如,假定该标准数据结构可以包括正态分布结构,可以通过诸如高斯分布变换、Box-Cox变换等算法对实际数据进行调整,以使其满足于正态分布的标准数据结构。步骤204,确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据。在一实施例中,所述被监控系统的运行周期在时间序列上被划分为若干时段;当所述性能指标在被选取的多个运行周期内的同一时段的历史数据均呈稳定状态时,所述同一时段被确定为属于所述稳定区间,当所述同一时段的历史数据在至少一个被选取的运行周期内呈不稳定状态时,所述同一时段被确定为属于所述不稳定区间。举例而言,假定被监控系统的运行周期为一天,选取的多个运行周期可以包括最近三天、即最近的连续三个运行周期,如果时段9:00~12:00在这三个运行周期内均处于稳定状态,可以将该时段9:00~12:00确定为属于稳定区间;而如果时段3:20~4:10在这三个运行周期内的至少一个运行周期处于不稳定状态,可以将该时段3:20~4:10确定为属于不稳定区间。在一实施例中,稳定区间可以包括一个或多个时段。在一实施例中,不稳定区间可以包括一个或多个时段。在一实施例中,可以按照特定的细粒度对运行周期进行时段划分,比如时、分、秒等,本说明书并不对此进行限制。在一实施例中,稳定状态的时段表明被监控系统在相关时段内的性能指标,能够在多个运行周期内均能够维持较小波动或不存在波动;而不稳定状态的时段表明被监控系统在相关本文档来自技高网...

【技术保护点】
1.一种异常设备的检测方法,其特征在于,包括:获取被监控系统的性能指标的实际数据;确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据;对所述第一实际数据进行评估得到第一评估结果、对所述第二实际数据进行评估得到第二评估结果;根据所述第一评估结果和第二评估结果确定所述被监控系统中的异常设备。

【技术特征摘要】
1.一种异常设备的检测方法,其特征在于,包括:获取被监控系统的性能指标的实际数据;确定所述实际数据中处于时间序列上的稳定区间的第一实际数据、处于时间序列上的不稳定区间的第二实际数据;对所述第一实际数据进行评估得到第一评估结果、对所述第二实际数据进行评估得到第二评估结果;根据所述第一评估结果和第二评估结果确定所述被监控系统中的异常设备。2.根据权利要求1所述的方法,其特征在于,所述被监控系统的运行周期在时间序列上被划分为若干时段;当所述性能指标在被选取的多个运行周期内的同一时段的历史数据均呈稳定状态时,所述同一时段被确定为属于所述稳定区间,当所述同一时段的历史数据在至少一个被选取的运行周期内呈不稳定状态时,所述同一时段被确定为属于所述不稳定区间。3.根据权利要求2所述的方法,其特征在于,所述不稳定状态的时段包括以下至少之一:峰值时段、噪声时段;所述稳定状态的时段包括所述运行周期内除所述不稳定状态的时段之外的其他时段。4.根据权利要求2所述的方法,其特征在于,所述稳定区间和所述不稳定区间是从所述运行周期内通过时序模式发现算法进行确定得到。5.根据权利要求1所述的方法,其特征在于,采用无监督算法对所述第一实际数据、所述第二实际数据进行评估。6.根据权利要求1所述的方法,其特征在于,通过以下可选算法中至少之一对所述第一实际数据进行评估:时间序列挖掘算法、聚类算法、统计学习算法、回归分析算法;通过以下可选算法中至少之一对所述第二实际数据进行评估:聚类算法、统计学习算法、回归分析算法。7.根据权利要求1所述的方法,其特征在于,当采用多种可选算法对所述第一实际数据进行评估时,每一可选算法存在对应的权重值,对所述第一实际数据的评估结果包括对多种可选算法分别得出的评估分值进行加权计算得到的第一加权评估分值;当采用多种可选算法对所述第二实际数据进行评估时,每一可选算法存在对应的权重值,对所述第二实际数据的评估结果包括对多种可选算法分别得出的评估分值进行加权计算得到的第二加权评估分值。8.根据权利要求7所述的方法,其特征在于,还包括:将所述评估结果与标记数据进行比较,以分析用于对所述第一实际数据或所述第二实际数据进行评估的各个可选算法的评估准确度;根据所述评估准确度对相应的可选算法进行改进。9.根据权利要求1所述的方法,其特征在于,还包括:针对所述被监控系统的性能指标进行相关性分析;当相关联的多个性能指标的实际数据均被获取时,筛除所述相关联的多个性能指标中至少一个性能指标的实际数据。10.一种异常设备的检测装置,其特征在于,包括:获取单元,...

【专利技术属性】
技术研发人员:朱婉怡豆龙超黄杰龙
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1