【技术实现步骤摘要】
一种基于综合差分的时序列分类方法
[0001]本专利技术涉及了一种时序列分类方法,具体涉及一种基于综合差分的时序列分类方法。
技术介绍
[0002]技术的飞速进步使得各行业数据的获取呈指数递增,而大量的观察数据都是时序列相关,从而使时序列数据的知识挖掘成为大数据处理中不可或缺的一个环节。数据挖掘的最基本面就是数据的类别分析,表现在数据空间对离群点安全阈值的把握及相应的分类。
[0003]时序列数据异常值检定方法中形式比较简单的是均值标准差法及中值绝对偏差MAD法,是基本的基于预测和分布的方法,缺点是对假设依赖比较严重。这类方法中复杂一点有比如指数加权移动平均EWMA法,该算法可以检测异常较短间隔后另一个异常,但异常若持续一段时间则可能被判定为正常。基于统计的方法准确率一般,常倾向于识别过多的点。
[0004]在看到了用移动平均的平滑效应来估值会导致原始数据信息的丢失后,算法采取了限制数据变化的速度和加速度来清除时序列数据的非正常值。实验结果显示对比移动平滑算法,这种基于制限的方法大大降低了误差并提高了计算速度。但是这种制限虽然对大突变有效,却难以检测出不明显的小尖峰。后续的算法虽然通过改变max/min最大/最小范围的制限为速度变化的概率分布来检测原本无效的小突变,但这种重回统计概率的方法有点脱离原本设计,并可能仍然是条件依赖的。
[0005]深度学习算法已经在各行业取得了非凡的成果,也同样用到了时序列异常值检定中,但神经网络需要训练模型,而深度学习尤其需要大量数据,计算复杂度高,参数需要人工 ...
【技术保护点】
【技术特征摘要】
1.一种基于综合差分的时序列分类方法,其特征在于:方法包括如下步骤:步骤1:将时序列数据进行差值处理获得差序列数据,将差序列数据进行升序排列处理获得升序序列数据;步骤2:选取升序序列数据中的中值并进行间距选取处理获得中值集合,将中值集合进行差值处理获得间距集合;步骤3:建立综合离散度模型,将中值集合和间距集合输入综合离散度模型中,综合离散度模型输出间距集合的综合离散度集合,利用综合离散度集合对步骤1中的时序列数据进行分类。2.根据权利要求1所述的一种基于综合差分的时序列分类方法,其特征在于:所述的步骤1中,将时序列数据S进行差值处理获得差序列数据,具体为将时序列数据S中每两个相邻的时序数值作差获得差值,各个差值构建为差序列数据S
’
,具体如下:S
’
{δ1,δ2,
…
,δ
i
,
…
,δ
N
‑1}其中,δ1,δ2,
…
,δ
i
,
…
,δ
N
‑1分别表示差序列数据S
’
中的第1、2、
…
、i、
…
、N
‑
1个差值,N表示时序列数据S的总长度;差序列数据S
’
中的第i个差值δ
i
具体如下:δ
i
=d
i+1
‑
d
i
其中,d
i+1
和d
i
分别表示时序列数据S中的第i+1和i个时序数值;将差序列数据S
’
进行升序排列处理获得升序序列数据S
A
,具体为将差序列数据S
’
中的各个差值按照从小到大的排列后构建为升序序列数据,具体如下:S
A
{A1,A2,
…
,A
j
,
…
,A
N
‑1}其中,A1,A2,
…
,A
j
,
…
,A
N
‑1分别表示升序序列数据S
A
中的第1、2、
…
、j、
…
、N
‑
1个升序数值。3.根据权利要求1所述的一种基于综合差分的时序列分类方法,其特征在于:所述的步骤2中,选取升序序列数据S
A
中的中值并进行间距选取处理获得中值集合,具体为当时序列数据S的总长度N为偶数时,选取的升序序列数据S
A
中的中值为升序序列数据S
A
中的第N/2个升序数值A
N/2
,当时序列数据S的总长度N为奇数时,选取的升序序列数据S
A
中的中值为升序序列数据S
A
中的第(N
‑
1)/2个升序数值A
(N
‑
1)/2
和第(N+1)/2个升序数值A
(N+1)/2
,将选取的中值构建为初始中值集合;然后进行间距选取处理,自升序序列数据S
A
中选取若干升序数值加入初始中值集合后获得最终的中值集合。4.根据权利要求3所述的一种基于综合差分的时序列分类方法,其特征在于:所述的间距选取处理具体为计算初始中值集合中的第一个值及其在升序序列数据S
A
中的前一个升序数值之间的间距作为前间距,计算初始中值集合中的最后一个值及其在升序序列数据S
A
中的后一个升序数值之间的间距作为后间距,比较前间距和后间距的大小,当前间距大于后间距时,则将初始中值集合中的最后一个值在升序序列数据S
A
中的后一个升序...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。