一种时间序列异常值检测方法、装置、设备及存储介质制造方法及图纸

技术编号:32794286 阅读:18 留言:0更新日期:2022-03-23 19:56
本发明专利技术公开了一种时间序列异常值检测方法、装置、设备及存储介质,该方法包括:获取当前需实现异常值检测的时间序列为待检测序列,使用STL分解算法将所述待检测序列分解为趋势分量、周期分量和余项;使用Boxplot和sigma搭配对所述余项进行异常值检测得到所述余项中的异常值,并确定所述余项中的异常值为目标值;确定所述目标值对应所述待检测序列中的值为所述待检测序列中的异常值,以实现所述时间序列的异常值检测。可见,本申请无需使用分类算法或者预测算法,更不需对历史数据进行人工标注,从而使得时间序列异常值检测能够简单易于实现。于实现。于实现。

【技术实现步骤摘要】
一种时间序列异常值检测方法、装置、设备及存储介质


[0001]本专利技术涉及异常检测
,更具体地说,涉及一种时间序列异常值检测方法、装置、设备及存储介质。

技术介绍

[0002]异常检测(Anomaly detection)是目前时序数据分析最常研究的方向之一,定义是从正常的时间序列中识别出不正常的事件或行为的过程。时间序列的异常检测问题通常表述为找到相对于某些标准或常规信号的异常数据点,这里通常有多种异常点类型,从业务的角度来看,通常只专注于最重要的,如:意外的峰值、意外的低谷与趋势突变等。一般而言,很多异常可以通过人工的方式来判断;然而当业务组合复杂、时序规模变大后,依靠传统的人工和简单的同比环比等绝对值算法来判断就显得捉襟见肘了。因此,在面对各种各样的工业级场景时,系统的了解时间序列异常检测方法尤为重要。
[0003]基本上异常检测算法分为两类,第一类使用分类算法,将每个时间点标记为异常/非异常,然后通过分类算法对每个时间点进行分类,缺点是需要对历史数据的异常/非异常进行人工标注,对人为的判断有明显的依赖;第二类使用预测算法,预测某个点的信号,然后测试该点实际值是否与预测值的差,然后观察其差是否足以将其视为异常,缺点是依赖于预算算法的准确度。

技术实现思路

[0004]本专利技术的目的是提供一种时间序列异常值检测方法、装置、设备及存储介质,无需使用分类算法或者预测算法,更不需对历史数据进行人工标注,从而使得时间序列异常值检测能够简单易于实现。
[0005]为了实现上述目的,本专利技术提供如下技术方案:
[0006]一种时间序列异常值检测方法,包括:
[0007]获取当前需实现异常值检测的时间序列为待检测序列,使用STL分解算法将所述待检测序列分解为趋势分量、周期分量和余项;
[0008]使用Boxplot和sigma搭配对所述余项进行异常值检测得到所述余项中的异常值,并确定所述余项中的异常值为目标值;
[0009]确定所述目标值对应所述待检测序列中的值为所述待检测序列中的异常值,以实现所述时间序列的异常值检测。
[0010]优选的,使用Boxplot和sigma搭配对所述余项进行异常值检测得到所述余项中的异常值,包括:
[0011]使用Boxplot对所述余项进行处理得到相应的最大观测值及最小观测值,使用sigma对所述余项进行处理得到相应的sigma值;
[0012]基于所述最大观测值、所述最小观测值及所述sigma值得到相应的数据范围,并确定所述余项中未在所述数据范围内的值为所述余项中的异常值。
[0013]优选的,基于所述最大观测值、所述最小观测值及所述sigma值得到相应的数据范围,包括:
[0014]按照下列公式得到所述数据范围:
[0015]low=3σ*ratio+min*(1

ratio),
[0016]hight=3σ*ratio+max*(1

ratio);
[0017]其中,σ为所述sigma值,min为所述最小观测值,max为所述最大观测值,ratio为权重系数,low为所述数据范围中的最小值,hight为所述数据范围中的最大值。
[0018]优选的,使用Boxplot和sigma搭配对所述余项进行异常值检测得到所述余项中的异常值之前,还包括:
[0019]如果当前时刻之前对预设个时间序列进行异常值检测时,检测出的异常值数量大于数量阈值,则采用4sigma作为当前时刻之后实现时间序列中异常值检测时所用的sigma,否则采用3sigma作为当前时刻之后实现时间序列中异常值检测时所用的sigma。
[0020]优选的,确定所述目标值对应所述待检测序列中的值为所述待检测序列中的异常值之后,还包括:
[0021]剔除所述待检测序列中的异常值,并利用缺失值填充方式得到剔除的所述异常值对应的正常值,并将得到的正常值加入至所述待检测序列中。
[0022]优选的,利用缺失值填充方式得到剔除的所述异常值对应的正常值,包括:
[0023]获取所述待检测序列中除异常值之外的其他值的平均值,作为剔除的所述异常值对应的正常值。
[0024]优选的,将得到的正常值加入至所述待检测序列中之后,还包括:
[0025]基于所述待检测序列预测当前时刻之后任意时刻指定区域内的人流数据,并将该任意时刻及预测得到的该任意时刻的人流数据输出;其中,所述时间序列为所述指定区域内不同时间的人流数据。
[0026]一种时间序列异常值检测装置,包括:
[0027]分解模块,用于:获取当前需实现异常值检测的时间序列为待检测序列,使用STL分解算法将所述待检测序列分解为趋势分量、周期分量和余项;
[0028]检测模块,用于:使用Boxplot和sigma搭配对所述余项进行异常值检测得到所述余项中的异常值,并确定所述余项中的异常值为目标值;
[0029]确定模块,用于:确定所述目标值对应所述待检测序列中的值为所述待检测序列中的异常值,以实现所述时间序列的异常值检测。
[0030]一种时间序列异常值检测设备,包括:
[0031]存储器,用于存储计算机程序;
[0032]处理器,用于执行所述计算机程序时实现如上任一项所述时间序列异常值检测方法的步骤。
[0033]一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述时间序列异常值检测方法的步骤。
[0034]本专利技术提供了一种时间序列异常值检测方法、装置、设备及存储介质,该方法包括:获取当前需实现异常值检测的时间序列为待检测序列,使用STL分解算法将所述待检测序列分解为趋势分量、周期分量和余项;使用Boxplot和sigma搭配对所述余项进行异常值
检测得到所述余项中的异常值,并确定所述余项中的异常值为目标值;确定所述目标值对应所述待检测序列中的值为所述待检测序列中的异常值,以实现所述时间序列的异常值检测。本申请使用STL分解算法将待检测的时间序列分解为趋势分量、周期分量和余项,然后利用Boxplot和sigma的搭配准则对余项进行异常值检测,检测出来的余项的异常值所对应的时间序列的值就是异常值,以实现时间序列中异常值的检测。可见,本申请无需使用分类算法或者预测算法,更不需对历史数据进行人工标注,从而使得时间序列异常值检测能够简单易于实现。
附图说明
[0035]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0036]图1为本专利技术实施例提供的一种时间序列异常值检测方法的流程图;
[0037]图2为本专利技术实施例提供的一种时间序列异常值检本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种时间序列异常值检测方法,其特征在于,包括:获取当前需实现异常值检测的时间序列为待检测序列,使用STL分解算法将所述待检测序列分解为趋势分量、周期分量和余项;使用Boxplot和sigma搭配对所述余项进行异常值检测得到所述余项中的异常值,并确定所述余项中的异常值为目标值;确定所述目标值对应所述待检测序列中的值为所述待检测序列中的异常值,以实现所述时间序列的异常值检测。2.根据权利要求1所述的方法,其特征在于,使用Boxplot和sigma搭配对所述余项进行异常值检测得到所述余项中的异常值,包括:使用Boxplot对所述余项进行处理得到相应的最大观测值及最小观测值,使用sigma对所述余项进行处理得到相应的sigma值;基于所述最大观测值、所述最小观测值及所述sigma值得到相应的数据范围,并确定所述余项中未在所述数据范围内的值为所述余项中的异常值。3.根据权利要求2所述的方法,其特征在于,基于所述最大观测值、所述最小观测值及所述sigma值得到相应的数据范围,包括:按照下列公式得到所述数据范围:low=3σ*ratio+min*(1

ratio),hight=3σ*ratio+max*(1

ratio);其中,σ为所述sigma值,min为所述最小观测值,max为所述最大观测值,ratio为权重系数,low为所述数据范围中的最小值,hight为所述数据范围中的最大值。4.根据权利要求3所述的方法,其特征在于,使用Boxplot和sigma搭配对所述余项进行异常值检测得到所述余项中的异常值之前,还包括:如果当前时刻之前对预设个时间序列进行异常值检测时,检测出的异常值数量大于数量阈值,则采用4sigma作为当前时刻之后实现时间序列中异常值检测时所用的sigma,否则采用3...

【专利技术属性】
技术研发人员:陈静静吴睿振张永兴张旭王凛
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1