利用自动阈值设置在多时间序列数据中实时地检测异常制造技术

技术编号:11024198 阅读:97 留言:0更新日期:2015-02-11 12:49
提供了一种用于在处理环境中检测异常的方法。所述方法包括利用处理器获得在处理环境的处理器的处理间隔中采集的值的序列。所述处理器正规化值的这一第一序列以获得正规化的值的第一序列。通过向所述正规化的值的第一序列应用预测滤波器来产生正规化的值的第二序列。通过将所述正规化的值的第一序列与所述正规化的值的第二序列相比较来从正规化的值产生比较分值。所述方法然后确定所述比较分值相对于从在所述处理间隔中采集的值导出的至少一个其它比较分值是否代表异常。

【技术实现步骤摘要】
【国外来华专利技术】在处理环境中实时地检测异常的方法和系统相关申请的交叉引用本申请要求2012年6月28日提交的美国专利申请序列号13/535,743以及2012年7月26日提交的美国专利申请序列号为13/558,727的权益,其每一个的全部内容通过引用结合于此。
本技术的一个方面涉及在处理环境中检测异常。
技术介绍
大规模主机基础设施和平台形成很多处理环境,包括用于云计算和企业数据中心的计算机系统。这些计算机系统的大小、所述系统执行的事务的数量以及处理的大量数据致使这些系统容易出现异常。异常是在进入的数据中的不期望的改变或进入的数据中的偏离所期望的行为的模式(pattern)。异常由例如瓶颈、内存泄露、硬件故障等引起。在复杂计算机系统上监视数据以发现异常并且实时地识别异常避免了这样的异常累积和影响系统的效率以及在最差的情况中导致系统或系统的一部分发生故障。
技术实现思路
通过提供用于在处理环境中检测异常的计算机程序产品,克服了现有技术的缺点并且提供了额外的优点。计算机程序产品例如包括能够由处理电路读取并且存储用于由处理电路执行以执行下述方法的指令的计算机可读存储介质,所述方法包括:由处理器获取在处理环境的处理器的处理间隔中采集的值的序列;由处理器正规化所述值的序列以获得正规化的值的第一序列;通过向所述正规化的值的第一序列应用预测滤波器来产生正规化的值的第二序列;通过将所述正规化的值的第一序列与所述正规化的值的第二序列相比较来产生比较分值;以及确定所述比较分值相对于从在所述处理间隔中采集的值中导出的至少一个其它比较分值是否代表异常。还描述并且在这里可以要求保护涉及本技术的一个或多个方面的计算机系统和方法。此外,还描述了并且在这里可以要求保护涉及本技术的一个或多个方面的服务。额外的特征通过本专利技术的技术实现。这里详细描述了本专利技术的其它实施例和各个方面,并且本专利技术的其它实施例和各个方面被视为所要求保护的专利技术的一部分。附图说明在说明书末尾处的权利要求中,本专利技术的一个或多个方面被具体指出并且作为示例而被明确要求保护。前述以及本专利技术的一个或多个方面的目标、特征和优点从下述结合附图进行的详细描述中变得清晰,其中:图1描述了用于执行本专利技术实施例的一个或多个方面的计算环境的一个示例;图2描述了用于执行包括本专利技术实施例的一个或多个方面的过程的逻辑的一个实施例;图3描述了示出了用于确定比较分值是否代表异常的计算的正常值范围的曲线图;图4描述了根据本专利技术的一个或多个方面的用于在处理环境中检测异常的方法的一个实施例的工作流程;图5描述了包含并且使用本专利技术的一个或多个方面的单处理器计算环境的一个实施例;以及图6描述了包含本专利技术的一个或多个方面的计算机程序产品的一个实施例。具体实施方式本技术代表了对先前的用于异常检测的系统和方法的改进,因为本技术实时地检测异常并且不使用诸如预先建立的预测模型和/或训练数据的基础数据。目前的异常检测解决方案在它们能够检测出异常之前需要基础数据。一些检测解决方案需要在该计算机系统内实现定义什么构成异常的模型。其它检测解决方案需要“训练数据,”即教导系统数据中的什么特性构成异常的数据。本专利技术的方面的自适应特性允许其开始实时地检测异常而不需要基础数据。图1描述了本技术的实施例的技术架构100。在该实施例中,计算机系统110(可以包括云和/或企业系统)正在被通过网络连接131连接到计算机系统110的服务器120监控。该网络连接131包括但不限于无线和/或有线连接。异常检测软件正在被服务器120上的一个或多个处理器(未画出)执行。在本技术的进一步实施例中,该异常检测软件在计算机系统110自身的资源上被执行。在本技术的进一步实施例中,该软件的执行分布在计算机系统110外部和/或内部的更多资源之一上。在该实施例中,服务器中的至少一个传感器130接收来自计算机系统110中的资源的时间序列中的数据。在计算机系统110是云或企业计算系统的实施例中,至少一个传感器130接收多个时间序列数据,因为该数据是从多于一个资源接收的。在进一步的实施例中,一个或多个传感器130位于计算机系统110内部和/或外部。参考图2,提供了本技术的异常检测系统的实施例的模块的图200。在该实施例中,采用一系列模块以在处理环境中确定是否存在异常。本技术评估在计算机系统中的时间序列中的给定数据是否包含异常。该模块包括但不限于:1)正规化(normalization)模块210;2)周期性(seasonal)调节模块220;3)多变量变换模块230;4)自适应预测滤波器240;5)分值计算模块250;6)分布间隔模块260;以及7)分类模块270。这些模块一起执行自适应逻辑以判定在序列(时间序列)中的数据是否包含异常。通过在时间序列中建立和调整关键性能指标(KPI),本技术最终确定在时间序列中的数据是否表示系统异常。本技术最终评估比较分值,即代表在给定时刻处的期望数据值和实际数据值之间的差的分值。通过将该比较分值与在相似的时间段期间在计算机系统中计算出的比较分值比较,本技术确定在该比较分值代表的时间期间是否出现系统异常。将单独的任务分到图2的实施例中的模块中是过程分布的非限制性示例,并且不表示计算机程序代码的结构或者该代码在哪里执行。本领域的技术人员会认识到,计算机程序代码的功能可以在一个或多个物理模块中实施并且在一个或多个处理器上、在一个或多个计算资源中执行。为说明的目的提供图2以指明本方法中的由特别配置的计算机执行的和/或在计算机程序产品中实施的不同活动。参考图2,正规化模块210被用于逐步地正规化在预定量的时间内或连续地以时间序列从计算机系统110中的多个源提供的事务数据。时间序列是通常在以均匀的时间间隔隔开的连续的时刻处测量出的数据点的序列。正规化模块210实时地监控由计算机系统处理的时间序列中的数据以建立平均值以及相对于平均值的标准差,即,关键性能指标(KPI)。每个KPI代表在给定时刻(t)的时间序列中的数据的特性。正规化模块210激活的时间越长,平均值和标准差就变得越准确。根据本专利技术的方面,不使用训练数据或数据模型来识别异常。替代地,正规化模块210以及该系统的其它模块是自适应的,自适应是指这些模块根据可用的资源改变它们的行为。因此,当接收到的数据中的模式(pattern)改变时,正规化模块210自适应。当数据随着时间积累时,系统的准确性提高。具体地,当程序启动时被初始地视为异常的内容将在之后被显示为不是异常的偏差。正规化模块210的输出是正规化的KPI。每个正规化的KPI代表与在给定时刻(t)由传感器130接收到的时间序列中的数据有关的值。在图1的实施例中,一旦数据变得可以从至少一个传感器130获得,正规化处理就在计算机系统110中开始。时间序列由xt=(xt(1)...xt(n))表示,其中t随时间不确定地增加;n的大小表示在给定时刻被监控的时间(time)的总数。当每个传感器从系统的各种部分采集各种数据时,x的分量是不相同的。在本技术的实施例中,数据的时间序列利用下述等式1被正规化为KPI。每个进入样本xt被实时地正规化如下:在时刻t的平均值μt和协方差矩阵Σt(假设是对角的)也被逐步地估计为:其中“Diag”指的是对角算符(提取矩阵对角线本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201380027836.html" title="利用自动阈值设置在多时间序列数据中实时地检测异常原文来自X技术">利用自动阈值设置在多时间序列数据中实时地检测异常</a>

【技术保护点】
一种计算机程序产品,用于在处理环境中检测异常,该计算机程序产品包括:计算机可读存储介质,可由处理电路读取并且存储用于由处理电路执行以执行方法的指令,所述方法包括:由处理器获得在处理环境的处理器的处理间隔中采集的值的序列;由处理器正规化所述值的序列以获得正规化的值的第一序列;通过向所述正规化的值的第一序列应用预测滤波器来产生正规化的值的第二序列;通过将所述正规化的值的第一序列与所述正规化的值的第二序列相比较来产生比较分值;以及确定所述比较分值相对于从在所述处理间隔中采集的值导出的至少一个其它比较分值是否代表异常。

【技术特征摘要】
【国外来华专利技术】2012.06.28 US 13/535,743;2012.07.26 US 13/558,7271.一种用于在处理环境中检测异常的方法,所述方法包括:由处理器获得在处理环境的处理器的处理间隔中采集的值的序列,其中所述值包括在所述处理环境中多个源提供的事务数据;由处理器正规化所述值的序列以获得正规化的值的第一序列;通过向所述正规化的值的第一序列应用预测滤波器来产生正规化的值的第二序列,其中所述正规化的值的第二序列的每一个正规化的值包括由所述预测滤波器基于所述第一序列的值在所述处理间隔的下一个时刻处预测的预测值;通过将所述正规化的值的第一序列与所述正规化的值的第二序列相比较来产生比较分值;以及确定所述比较分值相对于从在所述处理间隔中采集的值导出的至少一个其它比较分值是否代表异常。2.根据权利要求1所述的方法,其中所述正规化的值的第一序列和所述正规化的值的第二序列是按时间排序的,并且在所述正规化的值的第二序列中的第一位置具有与在所述正规化的值的第一序列中的第二位置相同的时刻,并且所述第一位置领先所述第二位置一个位置,并且其中所述产生比较分值包括:将来自所述正规化的值的第一序列的具有给定时刻位置的至少一个值与来自所述正规化的值的第二序列的具有给定时间位置的至少一个其它值相比较。3.根据权利要求1所述的方法,其中所述确定还包括:将四分位数间估计器应用到所述比较分值以及所述至少一个其它比较分值;以及使用来自四分位数间估计器的结果,建立代表正常处理活动的值范围,其中,所述至少一个其它比较分值位于该值范围内。4.根据权利要求1所述的方法,其中所述比较分值包括以下之一:所述第一序列和所述第二序列之间的差的平均值、所述第一序列和所述第二序列之间的差的中位数、所述第一序列和所述第二序列之间的几何平均值、所述第一序列和所述第二序列之间的加权平均值。5.根据权利要求1、2、3或4所述的方法,其中所述方法还包括:将多变量变换应用到所述正规化的值的第一序列以移除特定于所述处理环境的不需要的特性,其中所述应用将所述正规化的值的第一序列标准化以应用所述预测滤波器。6.根据权利要求5所述的方法,其中所述多变量变换利用以下之一:离散余弦变换、离散小波变换、主分量分析的统计估计变换、多维到多维映射。7.根据权利要求1、2、3或4所述的方法,其中所述预测滤波器包括以下之一:卡尔曼滤波器、衰减多项式存储滤波器、自回归滤波器、向前一步预测器。8.根据权利要求1、2、3或4所述的方法,其中所述处理间隔...

【专利技术属性】
技术研发人员:AE比姆
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1