一种针对极端运行条件下的时间序列上升异常识别方法技术

技术编号:24682753 阅读:34 留言:0更新日期:2020-06-27 07:48
本发明专利技术公开了一种针对极端运行条件下的时间序列上升异常识别方法,在训练阶段,划分时间单元,计算每个时间单元中训练数据的最大值和平均值,遍历所有时间单元,获取最大的最大值和最大的平均值为判别基数;在预警阶段,获取实时监测数据,计算当前时间单元内数据的最大值和平均值,并计算跳跃指数;判断跳跃指数是否大于跳跃阈值,若是,则判定当前时间单元发生了跳跃;否则进一步调整判别基数;分析相邻的时间单元,若发生跳跃的时间单元的数量超过了数量阈值,则发出报警信号。本发明专利技术在运行时仅占用极少内存,且运行速度快。同时具有较高的鲁棒性,可以过滤因数据抖动变大,或整体迁移造成的假性上升的情况。

A method for identifying the rising anomaly of time series under extreme operating conditions

【技术实现步骤摘要】
一种针对极端运行条件下的时间序列上升异常识别方法
本专利技术涉及数据处理
,更具体的说是涉及一种针对极端运行条件下的时间序列上升异常识别方法。
技术介绍
针对一些特定的领域,尤其是在设备异常监测方面,通过监测设备传感器按固定的时间间隔收集的某些状态信息,进行实时分析,一旦发现状态信息出现异常时,及时发出报警信号进行人工干预以最大程度减少损失。在设备状态信息异常中,上升异常最为常见。若状态信息前期平稳,但在某个时刻起出现上升趋势,这必然反应出设备的一种不正常现象,需向设备维护人员及时发出预警信号。现有的异常识别方法有多种类型,一般包括:基于模型的方法,基于距离的方法,以及基于深度学习的方法。然而由于某些特种装备的特殊性,只能为监测算法预留极为有限的储存空间和算力,并且对反应时间要求高,现有技术的上述方法针对在极端运行条件(内存空间小、运行速度极快)下运行的设备,均不能较好适用;具体分析如下:首先,基于模型的方法通常认为数据满足一定的统计规律,符合某种统计模型,当数据不满足应该有的统计模型时,则被认为是异常。然而,实际操作过程中由于每次使用仪器处理的事物不同,操作员使用习惯不同,仪器所处环境的温度、湿度不同等等不确定因素的存在,导致仪器的各项指标往往不能满足特定的统计规律,难以适用于极端运行条件下的场景。其次,基于距离的方法通常是通过异常点与其周围数据点的距离关系来计算出一个局部因子,通过局部因子来识别噪音。这类算法需要首先计算出所有数据的局部因子值,然后通过对这些因子值排序找出最大或最小的那部分数据,显然无法满足时效性,不能做到实时监测,同样难以适用于极端运行条件。另外,基于深度学习的异常识别方法是通过将异常识别嵌入到神经网络中,完成识别任务。但是深度学习算法占用空间很大,同时大部分基于深度学习的异常识别方法是有监督的,需要大量的训练数据,并且大部分的历史数据要满足有类似的分布规律。而在极端运行条件下运行的设备所完成的是高度复杂的任务,每次的设备运转都会产生形态各异的指标分布,无法为训练提供足够的训练数据。因此,提出一种能够适用于极端运行条件下的时间序列上升异常识别方法是本领域技术人员亟需解决的问题。
技术实现思路
有鉴于此,本专利技术提供了一种针对极端运行条件下的时间序列上升异常识别方法,在运行时仅占用极少内存,且运行速度很快,同时该方法具有较高的鲁棒性,可以有效过滤因数据抖动变大,或整体迁移造成的假性上升的情况。为了实现上述目的,本专利技术采用如下技术方案:一种针对极端运行条件下的时间序列上升异常识别方法,包括训练阶段和预警阶段;所述训练阶段包括以下内容:将训练数据集划分为n个时间单元,依次计算每个时间单元中训练数据的最大值和平均值,遍历所有时间单元,获取最大的最大值和最大的平均值,作为判别基数;所述预警阶段包括以下内容:S1.获取实时监测数据,计算当前时间单元内数据的最大值和平均值,并根据当前时间单元内数据的最大值和平均值计算当前时间单元的跳跃指数;S2.若跳跃指数大于跳跃阈值,且当前时间单元内数据的最大值和平均值均大于所述判别基数,则判定当前时间单元发生了跳跃;若跳跃指数小于跳跃阈值,且当前时间单元内数据的最大值和平均值均大于所述判别基数,则进一步调整判别基数;S3.分析相邻的时间单元,若发生跳跃的时间单元的数量超过了数量阈值,则发出报警信号。优选的,在进行训练阶段之前,确定训练时长,根据训练时长计算训练数据集需要时间单元的个数,其中,每个所述时间单元所需要的存储空间为dc。优选的,获取所述判别基数具体包括以下内容:依次计算每个时间单元中训练数据的最大值和平均值,并且只存储当前最大的最大值和最大的平均值;在遍历完所有时间单元后,获取所有训练数据中最大的最大值和最大的平均值作为预警阶段的所述判别基数;时间单元内训练数据的最大值和平均值的计算复杂度是o(dc),所需要的存储空间为dc+2,其中,dc个存储空间存储当前时间单元中的数据,2个存储空间用于存储所述判别基数。优选的,在S1中,获取实时监测数据后,当数据量凑够一个时间单元后,开始计算当前时间单元内数据的最大值和平均值。优选的,跳跃指数的具体计算方法为:将当前时间单元内数据的最大值和平均值与前m1个时间单元内数据的最大值和平均值分别进行比较,每出现大于的情况时,则跳跃指数增加a,与m1个时间单元均比较完成后,最终的累加值为当前时间单元的跳跃指数。优选的,所述跳跃阈值具体设置为m1/b。优选的,所述判别基数的调整方法为:对于最大值:首先计算当前时间单元内数据的最大值与原判别基数中的最大值的差值并称为最大值差值,进而计算a倍的最大值差值与原判别基数中的最大值之和;对于平均值:首先计算当前时间单元内数据的平均值与原判别基数中的平均值的差值并称为平均值差值,进而计算a倍的平均值差值与原判别基数中的平均值之和。优选的,S3的具体包括以下内容:分析相邻的m2个时间单元,其中m2>m1,若发生跳跃的时间单元的数量超过了数量阈值,则说明实时监测数据出现了上升趋势,发出报警信号。需要说明的是:m2和m1均为超参数。经由上述的技术方案可知,与现有技术相比,本专利技术公开提供了一种针对极端运行条件下的时间序列上升异常识别方法,包括以下有益效果:(1)内存占用极少:本专利技术总体所占用的内存空间约为m2个时间单元,这些时间单元相对于整个数据集而言占比微乎其微,甚至可以忽略不计;(2)运行速度快:本专利技术每次的计算操作仅仅发生在m2个时间单元上,且没有采用任何复杂的数学计算公式,因此运行速度很快;(3)高鲁棒性:数据抖动变大和整体迁移是常见的假性上升情况,其中,数据抖动变大只是数据振幅变大导致的数据的范围扩大,数据整体迁移是数据在某个时间节点向上平移;这两种情况都会造成数据的上界变大,但是并没有出现上升趋势;本专利技术在监测数据时,不断地判断数据是否出现假性上升,若出现则调整判别基数,从而减少了误判情况的发生。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1附图为本专利技术提供的一种针对极端运行条件下的时间序列上升异常识别方法的流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例公开了一种针对极端运行条件下的时间序列上升异常识别方法本文档来自技高网
...

【技术保护点】
1.一种针对极端运行条件下的时间序列上升异常识别方法,其特征在于,包括训练阶段和预警阶段;/n所述训练阶段包括以下内容:/n将训练数据集划分为n个时间单元,依次计算每个时间单元中训练数据的最大值和平均值,遍历所有时间单元,获取最大的最大值和最大的平均值,作为判别基数;/n所述预警阶段包括以下内容:/nS1.获取实时监测数据,计算当前时间单元内数据的最大值和平均值,并根据当前时间单元内数据的最大值和平均值计算当前时间单元的跳跃指数;/nS2.若跳跃指数大于跳跃阈值,且当前时间单元内数据的最大值和平均值均大于所述判别基数,则判定当前时间单元发生了跳跃;/n若跳跃指数小于跳跃阈值,且当前时间单元内数据的最大值和平均值均大于所述判别基数,则进一步调整判别基数;/nS3.分析相邻的时间单元,若发生跳跃的时间单元的数量超过了数量阈值,则发出报警信号。/n

【技术特征摘要】
1.一种针对极端运行条件下的时间序列上升异常识别方法,其特征在于,包括训练阶段和预警阶段;
所述训练阶段包括以下内容:
将训练数据集划分为n个时间单元,依次计算每个时间单元中训练数据的最大值和平均值,遍历所有时间单元,获取最大的最大值和最大的平均值,作为判别基数;
所述预警阶段包括以下内容:
S1.获取实时监测数据,计算当前时间单元内数据的最大值和平均值,并根据当前时间单元内数据的最大值和平均值计算当前时间单元的跳跃指数;
S2.若跳跃指数大于跳跃阈值,且当前时间单元内数据的最大值和平均值均大于所述判别基数,则判定当前时间单元发生了跳跃;
若跳跃指数小于跳跃阈值,且当前时间单元内数据的最大值和平均值均大于所述判别基数,则进一步调整判别基数;
S3.分析相邻的时间单元,若发生跳跃的时间单元的数量超过了数量阈值,则发出报警信号。


2.根据权利要求1所述的一种针对极端运行条件下的时间序列上升异常识别方法,其特征在于,在进行训练阶段之前,确定训练时长,根据训练时长计算训练数据集需要时间单元的个数,其中,每个所述时间单元所需要的存储空间为dc。


3.根据权利要求2所述的一种针对极端运行条件下的时间序列上升异常识别方法,其特征在于,获取所述判别基数具体包括以下内容:
依次计算每个时间单元中训练数据的最大值和平均值,并且只存储当前最大的最大值和最大的平均值;
在遍历完所有时间单元后,获取所有训练数据中最大的最大值和最大的平均值作为预警阶段的所述判别基数;
时间单元内训练数据的最大值和平均值的计算复杂度是o(dc),所需要的存储空间为dc+2,其中,dc个存储空间...

【专利技术属性】
技术研发人员:李琦庞贺金福生王树良岳鑫韩翔宇
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1