一种指标异常发现方法和装置制造方法及图纸

技术编号:20369478 阅读:25 留言:0更新日期:2019-02-16 19:48
本申请提供一种指标异常发现方法和装置。先获取预设时间段内,包含时间点和对应所述时间点的指标值的时间序列数据,再将所述时间序列数据拆解为非误差数据与误差数据,使用预设的假设检验算法计算时间序列内误差数据的分布规律,并确定当前误差数据是否符合所述时间序列内误差数据的分布规律,最后根据计算结果确定当前指标值的异常情况。本申请根据一段时间内指标数据的自身规律自动判断当前指标的异常情况,比起现有技术简单设定报警阈值来说,本说明书提供的方法可降低误报率且减少人工设定消耗的时间。

A Method and Device for Indicator Abnormal Discovery

This application provides a method and device for detecting index anomalies. Firstly, the time series data including the time points and the corresponding index values of the time points in the preset time period are obtained. Then the time series data are decomposed into non-error data and error data. The preset hypothesis testing algorithm is used to calculate the distribution law of the error data in the time series, and to determine whether the current error data conforms to the distribution law of the error data in the time series. Finally, the abnormal situation of the current index value is determined according to the calculation results. This application automatically judges the abnormal situation of the current index according to the rule of the index data over a period of time. Compared with the simple setting of alarm threshold in the existing technology, the method provided in this specification can reduce the false alarm rate and the time consumed by manual setting.

【技术实现步骤摘要】
一种指标异常发现方法和装置
本说明书涉及互联网
,尤其涉及一种指标异常发现方法和装置。
技术介绍
在实际工作中里,有越来越多的数据指标需要进行异常监测,举例说明,网页的访问流量就是一种需要监控的指标,如果该指标出现异常,则需要进行报警处理,以确定是否发生网络攻击等问题。现有技术中,通常需要人工设定每个指标的报警阈值,一种常用的策略就是将指标当前值与其同比值或环比值进行对比。举例说明,将指标的当前值与该指标24小时前的数据值进行对比,若两者差距在预设范围内,则认为该指标当前值没有异常。但这样的简单对比可能发生误报,且当需要监控的指标较多时,人工设定报警阈值需要消耗很多时间。
技术实现思路
针对上述技术问题,本说明书实施例提供一种指标异常发现方法和装置,技术方案如下:根据本说明书实施例的第一方面,提供一种指标异常发现方法,该方法包括:获取预设时间段内,包含时间点和对应所述时间点的指标值的时间序列数据;将所述时间序列数据拆解为非误差数据与误差数据,其中,非误差数据包括指标周期数据与指标趋势数据,误差数据为既不符合预置的指标周期规律,也不符合根据所述时间序列数据计算出的指标走势的数据;使用预设的假设检验算法计算时间序列内误差数据的分布规律,并确定当前误差数据是否符合所述时间序列内误差数据的分布规律;根据计算结果确定当前指标值的异常情况。根据本说明书实施例的第二方面,提供一种指标异常发现装置,该装置包括:时间序列获取模块:用于获取预设时间段内,包含时间点和对应所述时间点的指标值的时间序列数据;时间序列拆解模块:用于将所述时间序列数据拆解为非误差数据与误差数据,其中,非误差数据包括指标周期数据与指标趋势数据,误差数据为既不符合预置的指标周期规律,也不符合根据所述时间序列数据计算出的指标走势的数据;误差数据计算模块:用于使用预设的假设检验算法计算时间序列内误差数据的分布规律,并确定当前误差数据是否符合所述时间序列内误差数据的分布规律;指标异常确定模块:用于根据计算结果确定当前指标值的异常情况。根据本说明书实施例的第三方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现一种指标异常发现,该方法包括:获取预设时间段内,包含时间点和对应所述时间点的指标值的时间序列数据;将所述时间序列数据拆解为非误差数据与误差数据,其中,非误差数据包括指标周期数据与指标趋势数据,误差数据为既不符合预置的指标周期规律,也不符合根据所述时间序列数据计算出的指标走势的数据;使用预设的假设检验算法计算时间序列内误差数据的分布规律,并确定当前误差数据是否符合所述时间序列内误差数据的分布规律;根据计算结果确定当前指标值的异常情况。本说明书实施例所提供的技术方案,提供了一种指标异常发现方法,本说明书将一段时间内的指标数据拆解为非误差相关数据和误差相关数据,并检测当前误差相关数据是否符合一段时间内多个误差相关数据构成的概率分布规律,进而由当前误差相关数据的异常情况判断当前指标数据的异常情况。本说明书提供的方法根据一段时间内指标数据的自身规律自动判断当前指标的异常情况,比起现有技术简单设定报警阈值来说,本说明书提供的方法可降低误报率且较少人工设定消耗的时间。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本说明书一示例性实施例示出的指标异常发现方法的一种流程图;图2是本说明书一示例性实施例示出的时间序列数据的一种示意图;图3是本说明书一示例性实施例示出的指标异常发现方法的一种示意图;图4是本说明书一示例性实施例示出的时间序列数据中的趋势数据的一种示意图;图5是本说明书一示例性实施例示出的时间序列数据中的周期数据的一种示意图;图6是本说明书一示例性实施例示出的时间序列数据中的残差数据的一种示意图;图7是本说明书一示例性实施例示出的根据时间序列数据中的残差数据构建正态分布图的一种示意图;图8是本说明书一示例性实施例示出的指标异常发现方法的另一种流程图;图9是本说明书一示例性实施例示出的指标异常发现方法的另一种示意图;图10是本说明书一示例性实施例示出的指标异常发现装置的一种示意图;图11是本说明书一示例性实施例示出的一种计算机设备的结构示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。在实际工作中里,有越来越多的数据指标需要进行异常监测,举例说明,网页的访问流量就是一种需要监控的指标,如果该指标出现异常,则需要进行报警处理,以确定是否发生网络攻击等问题。现有技术中,通常需要人工设定每个指标的报警阈值,一种常用的策略就是将指标当前值与其同比值或环比值进行对比。举例说明,将指标的当前值与该指标24小时前的数据值进行对比,若两者差距在预设范围内,则认为该指标当前值没有异常。但这样的简单对比可能发生误报,且当需要监控的指标较多时,人工对各个指标设定报警阈值需要消耗很多时间。针对以上问题,本说明书实施例提供一种指标异常发现方法,以及一种用于执行该方法的指标异常发现装置,下面对本实施例涉及的指标异常发现方法进行详细说明,参见图1所示,该方法可以包括以下步骤:S101,获取预设时间段内,包含时间点和对应所述时间点的指标值的时间序列数据;通常情况下,时间点与对应时间点的指标值是从指标采集源自动记录的,如自动记录网页每分钟的访问流量,并将该指标值(访问流量)和对应的记录时间通过时间序列的方式进行展示。参考图2,为通过图像对一段时间序列数据进行展示的示意图;其中,指标数据的产生和采集是一个按时间固定发生的过程,当指标采集较频繁时,一段时间内累计的指标数据量就会很大,而在进行指标异常检测时,使用较长时间内的指标数据对检测的精确性更有利,但直接使用这段时间内本文档来自技高网...

【技术保护点】
1.一种指标异常发现方法,所述方法包括:获取预设时间段内,包含时间点和对应所述时间点的指标值的时间序列数据;将所述时间序列数据拆解为非误差数据与误差数据,其中,非误差数据包括指标周期数据与指标趋势数据,误差数据为既不符合预置的指标周期规律,也不符合根据所述时间序列数据计算出的指标走势的数据;使用预设的假设检验算法计算时间序列内误差数据的分布规律,并确定当前误差数据是否符合所述时间序列内误差数据的分布规律;根据计算结果确定当前指标值的异常情况。

【技术特征摘要】
1.一种指标异常发现方法,所述方法包括:获取预设时间段内,包含时间点和对应所述时间点的指标值的时间序列数据;将所述时间序列数据拆解为非误差数据与误差数据,其中,非误差数据包括指标周期数据与指标趋势数据,误差数据为既不符合预置的指标周期规律,也不符合根据所述时间序列数据计算出的指标走势的数据;使用预设的假设检验算法计算时间序列内误差数据的分布规律,并确定当前误差数据是否符合所述时间序列内误差数据的分布规律;根据计算结果确定当前指标值的异常情况。2.如权利要求1所述的方法,所述使用预设的假设检验算法计算时间序列内误差数据的分布规律,并确定当前误差数据是否符合所述时间序列内误差数据的分布规律,包括:根据时间序列内的误差数据构建正态分布图,并设定用于判定异常的置信区间;获取当前误差数据,若所述当前误差数据没有落在所述正态分布图的置信区间内,则判定当前指标数据异常。3.如权利要求1所述的方法,所述指标趋势数据的确定方法,包括:计算时间序列内的各个指标数据的滑动平均值,将所述滑动平均值作为指标趋势数据。4.如权利要求1所述的方法,所述指标周期规律是预先根据历史指标数据计算得出的。5.如权利要求1所述的方法,所述根据计算结果确定当前指标值的异常情况,包括:对所述时间序列数据进行掉0异常检测,获取掉0异常检测数据;根据计算结果与所述掉0异常检测数据确定当前指标值的异常情况。6.如权利要求1所述的方法,所述确定当前指标值的异常检测结果后,还包括:根据预设的过滤条件,从异常检测结果中去除业务相关的非异常指标变化。7.一种指标异常发现装置,所述装置包括:时间序列获取模块:用于获...

【专利技术属性】
技术研发人员:刘鸿鹏飞
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1