一种基于综合差分的时序列分类方法技术

技术编号:38878744 阅读:15 留言:0更新日期:2023-09-22 14:10
本发明专利技术公开了一种基于综合差分的时序列分类方法。方法包括:将时序列数据进行差值处理获得差序列数据,进行升序排列处理获得升序序列数据;选取中值并进行间距选取处理获得中值集合,进行差值处理获得间距集合;建立综合离散度模型,将中值集合和间距集合输入,输出综合离散度集合对时序列数据进行分类。本发明专利技术解决了拓展的时序列异常值问题,对于时序列的分类,由于加入了新的特征属性,检定结果更加符合实际,差异性减少,解释完整,表现了优越的一致性,本发明专利技术显出了正确率,安全性与稳定性方面的多项优势,是一种富有前景的新型技术。是一种富有前景的新型技术。是一种富有前景的新型技术。

【技术实现步骤摘要】
一种基于综合差分的时序列分类方法


[0001]本专利技术涉及了一种时序列分类方法,具体涉及一种基于综合差分的时序列分类方法。

技术介绍

[0002]技术的飞速进步使得各行业数据的获取呈指数递增,而大量的观察数据都是时序列相关,从而使时序列数据的知识挖掘成为大数据处理中不可或缺的一个环节。数据挖掘的最基本面就是数据的类别分析,表现在数据空间对离群点安全阈值的把握及相应的分类。
[0003]时序列数据异常值检定方法中形式比较简单的是均值标准差法及中值绝对偏差MAD法,是基本的基于预测和分布的方法,缺点是对假设依赖比较严重。这类方法中复杂一点有比如指数加权移动平均EWMA法,该算法可以检测异常较短间隔后另一个异常,但异常若持续一段时间则可能被判定为正常。基于统计的方法准确率一般,常倾向于识别过多的点。
[0004]在看到了用移动平均的平滑效应来估值会导致原始数据信息的丢失后,算法采取了限制数据变化的速度和加速度来清除时序列数据的非正常值。实验结果显示对比移动平滑算法,这种基于制限的方法大大降低了误差并提高了计算速度。但是这种制限虽然对大突变有效,却难以检测出不明显的小尖峰。后续的算法虽然通过改变max/min最大/最小范围的制限为速度变化的概率分布来检测原本无效的小突变,但这种重回统计概率的方法有点脱离原本设计,并可能仍然是条件依赖的。
[0005]深度学习算法已经在各行业取得了非凡的成果,也同样用到了时序列异常值检定中,但神经网络需要训练模型,而深度学习尤其需要大量数据,计算复杂度高,参数需要人工调整。此外,多数算法只聚焦在检测方法上却忽略对异常的解释,因而面临诸多限制与挑战。
[0006]单变量数据离散安全度的检定方法举抑中和法Pull anti采用了涨率及束率来描述数据的综合离散度,在安全性,稳定性,正确率,解释度方面都保有优势;把其拓展到通用分类问题上显得非常必要,时序列异常值问题(两类)就是其中之一。原始算法的Pull anti对时序列数据采用了简化处理,虽然比箱形图Box plot优越,但精确度还不充分。在未考虑时序特征时,Pull anti表现出优于Box plot的特点,但因数据性质仍检测出了一些非本因的离散。时序列数据的主要特点是前后相关,由于遮盖与淹没效应会使常规统计方法出现错误,检测一直是个难点。

技术实现思路

[0007]为了解决
技术介绍
中存在的问题,本专利技术所提供一种基于综合差分的时序列分类方法。对显著性差异的时序列数据,正向可识别差值本身就非常有效,所以可以构筑全数据背景下的正向差异检测来找到此种时序列数据的安全离散点。本专利技术方法是一种增强的离
散度检定法,对比同一数据集(两类)的基本方案,给出了更准确的结果。本专利技术通过加入时序列数据的特征因素来突出数据差异,从而达到更准确的分类效果。
[0008]本专利技术采用的技术方案是:
[0009]本专利技术基于综合差分的时序列分类方法包括如下步骤:
[0010]步骤1:将时序列数据进行差值处理获得差序列数据,将差序列数据进行升序排列处理获得升序序列数据。
[0011]步骤2:选取升序序列数据中的中值并进行间距选取处理获得中值集合,将中值集合进行差值处理获得间距集合。
[0012]步骤3:建立综合离散度模型,将中值集合和间距集合输入综合离散度模型中,综合离散度模型输出间距集合的综合离散度集合,利用综合离散度集合对步骤1中的时序列数据进行分类。
[0013]所述的步骤1中,将时序列数据S进行差值处理获得差序列数据,具体为将时序列数据S中每两个相邻的时序数值作差获得差值,各个差值构建为差序列数据S

,具体如下:
[0014]S

{δ1,δ2,


i
,


N
‑1}
[0015]其中,δ1,δ2,


i
,


N
‑1分别表示差序列数据S

中的第1、2、

、i、

、N

1个差值,N表示时序列数据S的总长度。
[0016]差序列数据S

中的第i个差值δ
i
具体如下:
[0017]δ
i
=d
i+1

d
i
[0018]其中,d
i+1
和d
i
分别表示时序列数据S中的第i+1和i个时序数值。
[0019]将差序列数据S

进行升序排列处理获得升序序列数据S
A
,具体为将差序列数据S

中的各个差值按照从小到大的排列后构建为升序序列数据,具体如下:
[0020]S
A
{A1,A2,

,A
j
,

,A
N
‑1}
[0021]其中,A1,A2,

,A
j
,

,A
N
‑1分别表示升序序列数据S
A
中的第1、2、

、j、

、N

1个升序数值。
[0022]所述的步骤2中,选取升序序列数据S
A
中的中值并进行间距选取处理获得中值集合,具体为当时序列数据S的总长度N为偶数时,选取的升序序列数据S
A
中的中值为升序序列数据S
A
中的第N/2个升序数值A
N/2
,当时序列数据S的总长度N为奇数时,选取的升序序列数据S
A
中的中值为升序序列数据S
A
中的第(N

1)/2个升序数值A
(N

1)/2
和第(N+1)/2个升序数值A
(N+1)/2
,将选取的中值构建为初始中值集合;然后进行间距选取处理,自升序序列数据S
A
中选取若干升序数值加入初始中值集合后获得最终的中值集合。
[0023]所述的间距选取处理具体为计算初始中值集合中的第一个值及其在升序序列数据S
A
中的前一个升序数值之间的间距作为前间距,计算初始中值集合中的最后一个值及其在升序序列数据S
A
中的后一个升序数值之间的间距作为后间距,比较前间距和后间距的大小,当前间距大于后间距时,则将初始中值集合中的最后一个值在升序序列数据S
A
中的后一个升序数值加入初始中值集合中的最后一个值之后,当前间距小于等于后间距时,则将初始中值集合中的第一个值在升序序列数据S
A
中的前一个升序数值加入初始中值集合中的第一个值之前,继续重复间距选取处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于综合差分的时序列分类方法,其特征在于:方法包括如下步骤:步骤1:将时序列数据进行差值处理获得差序列数据,将差序列数据进行升序排列处理获得升序序列数据;步骤2:选取升序序列数据中的中值并进行间距选取处理获得中值集合,将中值集合进行差值处理获得间距集合;步骤3:建立综合离散度模型,将中值集合和间距集合输入综合离散度模型中,综合离散度模型输出间距集合的综合离散度集合,利用综合离散度集合对步骤1中的时序列数据进行分类。2.根据权利要求1所述的一种基于综合差分的时序列分类方法,其特征在于:所述的步骤1中,将时序列数据S进行差值处理获得差序列数据,具体为将时序列数据S中每两个相邻的时序数值作差获得差值,各个差值构建为差序列数据S

,具体如下:S

{δ1,δ2,


i
,


N
‑1}其中,δ1,δ2,


i
,


N
‑1分别表示差序列数据S

中的第1、2、

、i、

、N

1个差值,N表示时序列数据S的总长度;差序列数据S

中的第i个差值δ
i
具体如下:δ
i
=d
i+1

d
i
其中,d
i+1
和d
i
分别表示时序列数据S中的第i+1和i个时序数值;将差序列数据S

进行升序排列处理获得升序序列数据S
A
,具体为将差序列数据S

中的各个差值按照从小到大的排列后构建为升序序列数据,具体如下:S
A
{A1,A2,

,A
j
,

,A
N
‑1}其中,A1,A2,

,A
j
,

,A
N
‑1分别表示升序序列数据S
A
中的第1、2、

、j、

、N

1个升序数值。3.根据权利要求1所述的一种基于综合差分的时序列分类方法,其特征在于:所述的步骤2中,选取升序序列数据S
A
中的中值并进行间距选取处理获得中值集合,具体为当时序列数据S的总长度N为偶数时,选取的升序序列数据S
A
中的中值为升序序列数据S
A
中的第N/2个升序数值A
N/2
,当时序列数据S的总长度N为奇数时,选取的升序序列数据S
A
中的中值为升序序列数据S
A
中的第(N

1)/2个升序数值A
(N

1)/2
和第(N+1)/2个升序数值A
(N+1)/2
,将选取的中值构建为初始中值集合;然后进行间距选取处理,自升序序列数据S
A
中选取若干升序数值加入初始中值集合后获得最终的中值集合。4.根据权利要求3所述的一种基于综合差分的时序列分类方法,其特征在于:所述的间距选取处理具体为计算初始中值集合中的第一个值及其在升序序列数据S
A
中的前一个升序数值之间的间距作为前间距,计算初始中值集合中的最后一个值及其在升序序列数据S
A
中的后一个升序数值之间的间距作为后间距,比较前间距和后间距的大小,当前间距大于后间距时,则将初始中值集合中的最后一个值在升序序列数据S
A
中的后一个升序...

【专利技术属性】
技术研发人员:付剑晶
申请(专利权)人:浙江传媒学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1