一种基于时序二维化和宽度学习的时间序列分类方法和系统技术方案

技术编号:28376267 阅读:141 留言:0更新日期:2021-05-08 00:03
一种基于时序二维化和宽度学习的时间序列分类方法,包括以下步骤:1)对输入数据进行归一化处理,得到X;2)利用四个子宽度学习系统和宽度学习对X进行特征提取,得到深度级联式宽度学习系统的输入U;3)深度级联式宽度学习系统对输入数据U进行分类。本发明专利技术将宽度学习和时序二维化相结合,提出了一种特征提取方式,不仅能充分地提取出时间序列的特征,而且能够起到降维的效果,提取出更适合深度级联式宽度学习系统的数据。特征提取完成后再利用深度级联式宽度学习系统进行分类,能够显著地减少时间成本和计算成本。本发明专利技术还提供一种基于时序二维化和宽度学习的时间序列分类的系统。

【技术实现步骤摘要】
一种基于时序二维化和宽度学习的时间序列分类方法和系统
本专利技术属于时间序列数据分类领域,具体而言,是一种基于时序二维化和宽度学习的时间序列分类方法和系统。
技术介绍
时间序列数据是按时间顺序进行观测的的观测值集合,是序列数据中一类重要数据对象,时间序列数据的特点包括数据量大、维度高等。分类和预测是数据挖掘领域的经典问题,然而由于时间序列数据的复杂性,在过去的研究中,时间序列数据分类预测已成为分类研究中的特殊挑战。大量工作致力于时间序列预测的开发和改进,包括从单变量到多变量、从离线到在线、从线性到非线性、从短时间序列到长时间序列等。不同的任务使用不同的技术处理。例如,单变量时间序列使用Kolmogorov-Smirnov统计假设检验,而多变量时间序列则使用HotellingT-squared统计假设检验。基于统计和人工智能的方法是时间序列预测的两种主要技术,包括自回归模型、神经网络、支持向量回归、高斯过程、模糊系统等等。在这些方法中,神经网络是使用最广泛的模型,尤其是在深度神经网络问世之后。2006年,Hinton等人提出深层结构具有更好的性能,重新引起了研究人员对神经网络的兴趣。时至今日,已经开发了许多类型的深度神经网络。深度神经网络在发现高维数据中的复杂结构方面非常强大,但是当所有参数都通过反向传播算法进行调整时,就会遇到时间成本高和梯度爆炸或消失的问题。申请号为201910836145.8的专利所公开的技术方案,一种基于改进脉冲神经网络的时间序列分类方法。此方法使用脉冲神经网络对时间序列信号进行分类,可以实现无监督学习,从而降低了对训练数据的要求。针对脉冲神经网络容易陷入局部最优的问题,使用循环学习率法确定学习率的上下限,使得学习率在合理的范围内循环变化,有效地提升了网络的全局寻优能力。该项技术应用于时间序列分类,然而脉冲神经网络训练时间长,即使能获得较好的识别率,但所需的时间成本、计算成本都成倍增加。本项专利提出的一种基于多种时序二维化方式和宽度学习的时间序列分类方法和系统具有快速学习的能力,并且利用多种时序二维化方式与宽度学习结合的特征提取方式,充分地提取出时间序列数据的特征,提升分类性能。
技术实现思路
本专利技术为了缓解时间序列数据分类困难和深度学习分类方法时间成本、计算成本高的问题,提供了一种基于时序二维化和宽度学习的时间序列分类方法和系统。本专利技术将宽度学习和时序二维化相结合,提出了一种特征提取方式,不仅能充分地提取出时间序列的特征,而且能够起到降维的效果,提取出更适合深度级联式宽度学习系统的数据。特征提取完成后再利用本专利技术中提出的深度级联式宽度学习系统进行分类,能够显著地减少时间成本和计算成本。本专利技术实现上述专利技术目的所采用的技术方案如下:一种基于时序二维化和宽度学习的时间序列分类方法,包括以下步骤:S1:对输入数据进行归一化处理,得到X∈RN×d,其中,N是样本数量,d是每个样本的维数;S2:利用四个子宽度学习系统和宽度学习对X进行特征提取,得到深度级联式宽度学习系统的输入U;S3:深度级联式宽度学习系统对输入数据U进行分类。进一步的,所述步骤S1具体包括:S1.1:使用公开时间序列数据集UCR作为样本数据,读取样本数据;S1.2:对样本数据进行归一化处理,将样本数据范围归一化到[-1,1],将样本数据记为x,则经过归一化后的数据X可表示为:其中,xmin、xmax分别表示x的最小值和最大值,而axis=0表示是对样本数据的每一列求最值。进一步的,所述步骤S2具体包括:S2.1:对X进行时序二维化转换:S2.1.1:第一个子宽度学习系统的数据编码方式为递归图(RecurrencePlot,RP),将X转化为二维纹理图数据,再展平得到H∈RN×h,其中h是RP转化完成后每个样本的维数;S2.1.2:第二个子宽度学习系统的编码方式为格拉姆角求和场(GramianAngularSummationField,GASF),将X转化为二维纹理图数据,再展平得到K∈RN×k,其中k是GASF转化完成后每个样本的维数;S2.1.3:第三个子宽度学习系统的编码方式为格拉姆角求差场(GramianAngularDifferenceField,GADF),将X转化为二维纹理图数据,再展平得到S∈RN×s,其中s是GADF转化完成后每个样本的维数;S2.1.4:第四个子宽度学习系统的编码方式为马尔可夫域(MarkovTransitionFields,MTF),将X转化为二维纹理图数据,再展平得到J∈RN×j,其中j是MTF转化完成后每个样本的维数;S2.2:将步骤S2.1得到的数据H、K、S、J作为相应子宽度学习系统中宽度学习部分的输入,宽度学习部分训练网络的第一层是特征节点和增强节点,第二层是输出层,其中特征节点全连接到增强节点,然后特征节点和增强节点又拼接在一起全连接到输出层。训练完成后,把四个子宽度学习系统中宽度学习部分的输出记为UH、UK、US、UJ:S2.2.1:将第一个子宽度学习系统中时序二维化后的输出H映射为特征节点,对应特征节点输出为:ZH=ΦZH(HWZH+βZH)(2)S2.2.2:再将特征节点映射为增强节点,对应的增强节点输出为:HH=ΦHH(ZHWHH+βHH)(3)其中WEH、WHH是映射权重,βZH、βHH是偏置项,映射权重和偏置项都是随机生成的,ΦZH、ΦHH是任意激活函数;S2.2.3:第一个子宽度学习系统的输出为:UH=AHWH(4)其中,AH=[ZH,HH],WH通过求解伪逆得到的,目标函数如下:其中,Y是类别标签集合,λH是对WH进行进一步约束的超参数,这种求伪逆的方法等效于岭回归算法。从而得到:其中,I为单位矩阵;S2.2.4:第二个子宽度学习系统的宽度学习的训练过程与第一个子宽度学习系统的宽度学习的训练过程相同,系统输出记为UK;S2.2.5:第三个子宽度学习系统的宽度学习的训练过程与第一个子宽度学习系统的宽度学习的训练过程相同,系统输出记为US;S2.2.6:第四个子宽度学习系统的宽度学习的训练过程与第一个子宽度学习系统的宽度学习的训练过程相同,系统输出记为UJ;S2.3:将四个子宽度学习系统的最终输出拼接,记为:Z=[UH,UK,US,UJ](7)S2.4:对Z进行一次宽度学习得到深度级联式宽度学习系统的输入U。进一步的,所述步骤S3具体包括:S3.1:深度级联式宽度学习系统是由n个宽度学习串联而成,上一个宽度学习的输出作为下一个宽度学习的输入,将最后一个宽度学习的输出作为深度级联式宽度学习系统的分类结果。深度级联式宽度学习系统中的每个宽度学习训练过程与步骤S2.2.1~S2.2.3中所述的宽度学习训练过程一致,步骤S2.4中得到的U作为第一个宽度学习BLS1的输入,BLS1的输出作本文档来自技高网
...

【技术保护点】
1.一种基于时序二维化和宽度学习的时间序列分类方法,包括如下步骤:/nS1:对输入数据进行归一化处理,得到X∈R

【技术特征摘要】
1.一种基于时序二维化和宽度学习的时间序列分类方法,包括如下步骤:
S1:对输入数据进行归一化处理,得到X∈RN×d,其中,N是样本数量,d是每个样本的维数;
S2:利用四个子宽度学习系统和宽度学习对X进行特征提取,得到深度级联式宽度学习系统的输入U;
S3:深度级联式宽度学习系统对输入数据U进行分类。


2.如权利要求1所述的一种基于时序二维化和宽度学习的时间序列分类方法,其特征在于:所述步骤S1具体包括:
S1.1:使用公开时间序列数据集UCR作为样本数据,读取样本数据:
S1.2:对样本数据进行归一化处理,将样本数据范围归一化到[-1,1],将样本数据记为x,则经过归一化后的数据X可表示为:



其中,xmin、xmax分别表示x的最小值和最大值,而axis=0表示是对样本数据的每一列求最值。


3.如权利要求1所述的一种基于时序二维化和宽度学习的时间序列分类方法,其特征在于:所述步骤S2具体包括:
S2.1:对X进行时序二维化转换:
S2.1.1:第一个子宽度学习系统的数据编码方式为递归图(RecurrencePlot,RP),将X转化为二维纹理图数据,再展平得到H∈RN×h,其中h是RP转化完成后每个样本的维数;
S2.1.2:第二个子宽度学习系统的编码方式为格拉姆角求和场(GramianAngularSummationField,GASF),将X转化为二维纹理图数据,再展平得到K∈RN×k,其中k是GASF转化完成后每个样本的维数;
S2.1.3:第三个子宽度学习系统的编码方式为格拉姆角求差场(GramianAngularDifferenceField,GADF),将X转化为二维纹理图数据,再展平得到S∈RN×s,其中s是GADF转化完成后每个样本的维数;
S2.1.4:第四个子宽度学习系统的编码方式为马尔可夫域(MarkovTransitionFields,MTF),将X转化为二维纹理图数据,再展平得到J∈RN×j,其中j是MTF转化完成后每个样本的维数;
S2.2:将步骤S2.1得到的数据H、K、S、J作为相应子宽度学习系统中宽度学习部分的输入,宽度学习部分训练网络的第一层是特征节点和增强节点,第二层是输出层,其中特征节点全连接到增强节点,然后特征节点和增强节点又拼接在一起全连接到输出层;训练完成后,把四个子宽度学习系统中宽度学习部分的输出记为UH、UK、US、UJ:
S2.2.1:将第一个子宽度学习系统中时序二维化后的输出H映射为特征节点,对应特征节点输出为:
ZH=ΦZH(HWZH+βZH)(2)
S2.2.2:再将特征节点映射为增强节点,对应的增强节点输出为:
HH=ΦHH(ZHWHH+βHH)(3)
其中WEH、WHH是映射权重,βZH、βHH是偏置项,映射权重和偏置项都是随机生成的,ΦZH、ΦHH是任意激活函数;
S2.2.3:第一个子宽度学习系统的输出为:
UH=AHWH(4)
其中,AH=[ZH,HH],WH通过求解伪逆得到的,目标函数如下:



其中,Y是类别标签集合,λH是对WH进行进一步约束的超参数,这种求伪逆的方法等效于岭回归算法;从而得到:



其中,I为单位矩阵;
S2.2.4:第二个子宽度学习系统的宽度学习的训练过程与第一个子宽度学习系统的宽度学习的训练过程相同,系统输出记为UK;
S2.2.5:第三个子宽度学习系统的宽度学习的训练过程与第一个子宽度学习系统的宽度学习的训练过程相同,系统输出记为US;
S2.2.6:第四个子宽度学习系统的宽度学习的训练过程与第一个子宽度学习系统的宽度学习的训练过程相同,系统输出记为UJ;
S2.3:将四个子宽度学习系统的最终输出拼接,记为:
Z=[UH,UK,US,UJ](7)
S2.4:对Z进行一次宽度学习得到深度级联式宽度学习系统的输入U。


4.如权利要求1所述的一种基于时序二维化和宽度学习的时间序列分类方法,其特征在于:所述步骤S3具体包括:
S3.1:深度级联式宽度学习系统是由n个宽度学习串联而成,上一个宽度学习的输出作为下一个宽度学习的输入,将最后一个宽度学习的输出作为深度级联式宽度学习系统的分类结果;深度级联式宽度学习系统中的每个宽度学习训练过程与步骤S2.2.1~S2.2.3中所述的宽度学习训练过程一致,步骤S2.4中得到的U作为第一个宽度学习BLS1的输入,BLS1的输出作为BLS2的输入,以此类推;最后,将第n个宽度学习BLSn输出的概率分布矩阵转化成标签集合并计算出识别...

【专利技术属性】
技术研发人员:宣琦冯婷婷项靖阳徐东伟
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1