基于距离的面向时间序列分类的数据转换方法和系统技术方案

技术编号:34468363 阅读:35 留言:0更新日期:2022-08-10 08:41
本发明专利技术涉及时间序列数据挖掘技术领域,具体涉及基于距离的面向时间序列分类的数据转换方法和系统,其中方法包括:定义时间序列的分辨率,在对应分辨率下确定时间窗口的大小,然后根据滑动窗口将时间序列划分为一系列子序列,计算对应滑动窗口每一个窗口位置下子序列与其他时间序列的子序列之间的平均距离;对平均距离进行升序排序,根据分裂间隙计算其信息增益;根据不同滑动窗口位置的信息增益,选取最大的信息增益值作为对应滑动窗口位置下类别的判别度量,对各滑动窗口进行排名,根据滑动窗口的排名,选择删除信息增益最小的滑动窗口子序列实现转换操作,得到转换后的时间序列。根据本发明专利技术的方法,可以取得比其他算法更好的分类结果。好的分类结果。好的分类结果。

【技术实现步骤摘要】
基于距离的面向时间序列分类的数据转换方法和系统


[0001]本专利技术涉及时间序列数据挖掘
,尤其涉及一种基于距离的面向时间序列分类的数据转换方法和系统。

技术介绍

[0002]时间序列分类(TSC)从时间序列(可能是多变量)中预测离散目标变量的问题。TSC是机器学习的重要领域,在过去几十年中发展非常迅速。许多领域会产生或用到大量的时间序列数据,包括医疗数据、地震监测、昆虫分类预测维护等。
[0003]分类问题通常依赖于相似性或非相似性度量,时间序列分类也是如此。在过去十年中,时间序列分类研究中最精确和最稳健的方法是最近邻算法。时间序列相似性的主要研究如下:
[0004]频域相似性。一个简单的例子是基于距离度量的简单最近邻算法(NN)。基本度量包括欧几里得距离、动态时间规整(DTW)、基于导数的动态时间规整(DDTW)、加权动态时间规整(WDTW)、基于编辑距离的动态时间规整(TWE)等。Keogh首先将基于动态时间规整距离的精确索引应用于时间序列挖掘中。基于集成的方法是使用单个时间序列分类方法的集成。Elastic En本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于距离的面向时间序列分类的数据转换方法,其特征在于,包括:定义时间序列的分辨率,在对应分辨率下确定时间窗口的大小,然后根据所述时间窗口的大小和滑动步长产生的滑动窗口将时间序列划分为一系列子序列,并计算对应滑动窗口每一个窗口位置下子序列与其他时间序列的子序列之间的平均距离;对所述平均距离进行升序排序,根据分裂间隙计算其信息增益;根据不同滑动窗口位置的信息增益,选取最大的信息增益值作为对应滑动窗口位置下类别的判别度量,对各滑动窗口进行排名,根据滑动窗口的排名,选择删除信息增益最小的滑动窗口子序列实现对原时间序列做转换操作,得到转换后的时间序列。2.根据权利要求1所述的基于距离的面向时间序列分类的数据转换方法,其特征在于,分辨率定义如下,所述滑动窗口的大小为w,基数r=0.0125,其中,所述滑动窗口的大小w为r的偶数倍,且为2

16之间的偶数倍。3.根据权利要求1所述的基于距离的面向时间序列分类的数据转换方法,其特征在于,定义时间序列的分辨率,在对应分辨率下确定时间窗口的大小,然后根据所述时间窗口的大小和滑动步长产生的滑动窗口将时间序列划分为一系列子序列,并计算对应滑动窗口每一个窗口位置下子序列与其他时间序列的子序列之间的平均距离为:根据滑动窗口的参数配置,将原始时间序列进行划分,包括:使用p表示窗口位置,根据窗口划分参数确定窗口的开始位置和结束位置;截取开始位置到结束位置之间的序列为子序列,并对子序列进行归一化处理;对每一条时间序列数据进行以上处理,得到每一个时间序列对应在窗口位置p处的子序列;对于位置p下所有子序列与其他实例之间的平均距离可以表示为其中分别表示第一条、第二条
···
第m条时间序列在窗口位置p处子序列与其他实例之间的平均距离;对每一个窗口位置进行以上处理,最终得到每个窗口位置下子序列与其他序列之间的平均距离的集合AD。4.根据权利要求1所述的基于距离的面向时间序列分类的数据转换方法,其特征在于,对所述平均距离进行升序排序,根据分裂间隙计算其信息增益为:根据得到的每个窗口位置下子序列与其他时间序列的子序列之间的平均距离,对每个窗口位置下每个子序列与其他时间序列的子序...

【专利技术属性】
技术研发人员:李晖王可
申请(专利权)人:贵州优联博睿科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1