时间序列异常值检测方法及装置制造方法及图纸

技术编号:15500955 阅读:47 留言:0更新日期:2017-06-03 22:33
本发明专利技术公开了一种时间序列异常值检测方法及装置,涉及数据分析技术领域,用于提高时间序列异常值的检测效果,本发明专利技术的主要技术方案为:根据历史时间序列训练第一时间模型和第二时间模型;获取第一时间模型和第二时间模型分别对应的预测值、方差;通过所述第一时间模型和第二时间模型分别对应的预测值、方差计算混合模型的预测值;计算所述混合模型的预测值与所述历史时间序列的观测值之差得到白噪音分布;将所述白噪音分布中不在正常置信区间的值确定为异常值。本发明专利技术用于检测时间序列的异常值。

Method and device for detecting abnormal value of time series

The invention discloses a time series outlier detection method and device, and relates to the technical field of data analysis, improve the effect for the detection of abnormal value of time series, the main technical scheme of the invention is: according to the sequence of training time history first time model and second time model; prediction respectively corresponding to the first time model and second time model the predicted value, variance; mixed model prediction respectively by the first time model and second time model value, the variance of the prediction calculation; the mixture model of the observed value and the historical values of the time series of poor white noise distribution; the white noise distribution in normal confidence the interval values determined for abnormal value. The present invention is used to detect abnormal values of time series.

【技术实现步骤摘要】
时间序列异常值检测方法及装置
本专利技术涉及数据分析
,特别是涉及一种时间序列异常值检测方法及装置。
技术介绍
在自动化运维
中,时间序列在过程工业、金融业以及通信业等各领域中普遍存在,通过时间序列异常值检测可提前发现系统运行问题,因此对时间序列分析研究受到很多学者的关注。在时间序列的众多研究课题中,时间序列异常值检测因其直接关系时间序列的质量成为时间序列研究的重点。目前,一般通过单个的时间模型检测时间序列异常值,如通过动态线性模型,ARMA(Auto-RegressiveandMovingAverageModel,自回归滑动平均模型)以及季节性等模型检测时间序列异常值。即异常值检测主要取决于时间模型的预测效果,如果时间模型效果不稳定将会影响异常值检测的效果。
技术实现思路
有鉴于此,本专利技术提供一种时间序列异常值检测方法及装置,主要目的在于提高时间序列异常值的检测效果。依据本专利技术一个方面,提供了一种时间序列异常值检测方法,包括:根据历史时间序列训练第一时间模型和第二时间模型,第一时间模型和第二时间模型用于计算混合模型的预测值;获取第一时间模型和第二时间模型分别对应的预测值、方差;通过所述第一时间模型和第二时间模型分别对应的预测值、方差计算所述混合模型的预测值;计算所述混合模型的预测值与所述历史时间序列的观测值之差得到白噪音分布;将所述白噪音分布中不在正常置信区间的值确定为异常值。依据本专利技术一个方面,提供了一种时间序列异常值检测装置,包括:训练单元,用于根据历史时间序列训练第一时间模型和第二时间模型,第一时间模型和第二时间模型用于计算混合模型的预测值;获取单元,用于获取第一时间模型和第二时间模型分别对应的预测值、方差;计算单元,用于通过所述第一时间模型和第二时间模型分别对应的预测值、方差计算所述混合模型的预测值;所述计算单元,还用于计算所述混合模型的预测值与所述历史时间序列的观测值之差得到白噪音分布;确定单元,用于将所述白噪音分布中不在正常置信区间的值确定为异常值。借由上述技术方案,本专利技术实施例提供的技术方案至少具有下列优点:本专利技术实施例提供一种时间序列异常值检测方法及装置,与目前通过单个的时间模型检测时间序列异常值相比,本专利技术实施例利用模型混合的方法综合考虑多个模型的预测值得出最合理的预测值,因此只要多个时间模型中一个模型在数据序列上效果表现良好,那么混合模型将会在时间序列上取得良好的预测效果,从而通过本专利技术实施例提高了时间序列异常值的检测效果。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种时间序列异常值检测方法流程图;图2示出了本专利技术实施例提供的时间序列异常值检测结果图;图3示出了本专利技术实施例提供的一种时间序列异常值检测装置的结构框图;图4示出了本专利技术实施例提供的另一种时间序列异常值检测装置的结构框图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术实施例提供了一种时间序列异常值检测方法,如图1所示,该方法包括:101、根据历史时间序列训练第一时间模型和第二时间模型。其中,第一时间模型和第二时间模型用于计算混合模型的预测值,历史时间序列为训练时间模型的样本,具体可以选择数据库中前一天的时间序列作为训练样本。在本专利技术实施例中,第一时间模型和第二时间模型是不同的时间模型且各时间模型的训练过程是相互独立的,第一时间模型和第二时间模型具体可以为:动态线性模型,季节性等模型,以及ARMA(Auto-RegressiveandMovingAverageModel,自回归滑动平均模型)等,本专利技术实施例不做具体限定。102、获取第一时间模型和第二时间模型分别对应的预测值、方差。在通过步骤101获取到训练的第一时间模型和第二时间模型之后,具体可以根据卡尔曼滤波算法得到第一时间模型、第二时间模型分别对应的预测值。然后分别计算第一时间模型与第二时间模型中预测值的平均值,并依据方差公式:S^2=〈(X1-M)^2+(X2-M)^2+(X3-M)^2+…+(Xn-M)^2〉/n-1计算第一时间模型与第二时间模型分别对应的方差。其中,X1,X2,X3,…Xn是通过第一时间模型或第二时间模型得到的预测值,M代表预测值的平均值,n为预测值的个数。103、通过所述第一时间模型和第二时间模型分别对应的预测值、方差计算所述混合模型的预测值。在本专利技术实施例中,步骤103包括:根据所述第一时间模型和所述第二时间模型分别对应的方差计算所述混合模型的混合系数;根据所述第一时间模型和第二时间模型分别对应的预测值和所述混合系数计算混合模型的预测值。对于本专利技术实施例,所述根据所述第一时间模型和所述第二时间模型分别对应的方差计算所述混合模型的混合系数包括:计算所述第一时间模型的方差与所述第二时间模型的方差之和得到方差和;根据所述第一时间模型的方差与所述方差和的比值获取所述混合系数。具体的,可通过融合第一时间模型和第二时间模型预测值得到混合模型的预测值,获取混合模型的预测值的公式具体可以为:X=x1+K(x2-x1),其中v1为第一时间模型的方差,v2为第二时间模型的方差,K为混合系数,X为混合模型的预测值。在本专利技术实施例中,所述根据所述第一时间模型和第二时间模型分别对应的预测值和所述混合系数计算混合模型的预测值包括:计算所述第二时间模型的预测值与所述第一时间模型的预测值之差得到预测差值;通过计算所述预测差值与所述混合系数的乘积与所述第一时间模型的预测值的和得到所述混合模型的预测值。例如,通过x1表示第一时间模型的预测值,x2表示第二时间模型的预测值,则通过混合模型预测值公式X=x1+K(x2-x1)求得混合模型的预测值。需要说明的是,为了使得到的混合模型的预测值的效果更好,还可以通过训练的其他时间模型对得到的混合模型再次进行融合。如在步骤101中根据历史时间序列还训练有第三时间模型,则在通过步骤103得到混合模型之后,再根据得到的混合模型和第三时间模型对通过第一时间模型和第二时间模型得到的混合模型进行再次融合,即通过两两融合时间模型的方式得到混合模型,从而本专利技术实施例中的混合模型实现了多种时间模型的融合。104、计算所述混合模型的预测值与所述历史时间序列的之差得到白噪音分布。105、将所述白噪音分布中不在正常置信区间的值确定为异常值。对于本专利技术实施例,正常置信区间可以根据混合模型的预测值得到,即首先求得混合模型预测值的均值及标准差,然后通过混合模型的均值和标准差设置正常的置信区间。如图2所示的时间序列异常值检测结果图中本文档来自技高网...
时间序列异常值检测方法及装置

【技术保护点】
一种时间序列异常值检测方法,其特征在于,包括:根据历史时间序列训练第一时间模型和第二时间模型,第一时间模型和第二时间模型用于计算混合模型的预测值;获取第一时间模型和第二时间模型分别对应的预测值、方差;通过所述第一时间模型和第二时间模型分别对应的预测值、方差计算所述混合模型的预测值;计算所述混合模型的预测值与所述历史时间序列的观测值之差得到白噪音分布;将所述白噪音分布中不在正常置信区间的值确定为异常值。

【技术特征摘要】
1.一种时间序列异常值检测方法,其特征在于,包括:根据历史时间序列训练第一时间模型和第二时间模型,第一时间模型和第二时间模型用于计算混合模型的预测值;获取第一时间模型和第二时间模型分别对应的预测值、方差;通过所述第一时间模型和第二时间模型分别对应的预测值、方差计算所述混合模型的预测值;计算所述混合模型的预测值与所述历史时间序列的观测值之差得到白噪音分布;将所述白噪音分布中不在正常置信区间的值确定为异常值。2.根据权利要求1所述的方法,其特征在于,所述通过所述第一时间模型和第二时间模型分别对应的预测值、方差计算混合模型的预测值包括:包括:根据所述第一时间模型和所述第二时间模型分别对应的方差计算所述混合模型的混合系数;根据所述第一时间模型和第二时间模型分别对应的预测值和所述混合系数计算混合模型的预测值。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一时间模型和第二时间模型分别对应的预测值和所述混合系数计算混合模型的预测值包括:计算所述第二时间模型的预测值与所述第一时间模型的预测值之差得到预测差值;通过计算所述预测差值与所述混合系数的乘积与所述第一时间模型的预测值的和得到所述混合模型的预测值。4.根据权利要求2所述的方法,其特征在于,所述根据所述第一时间模型和所述第二时间模型分别对应的方差计算所述混合模型的混合系数包括:计算所述第一时间模型的方差与所述第二时间模型的方差之和得到方差和;根据所述第一时间模型的方差与所述方差和的比值...

【专利技术属性】
技术研发人员:孙木鑫石子凡
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1