当前位置: 首页 > 专利查询>湖南大学专利>正文

基于深度学习的多元时间序列多层时空依赖建模方法技术

技术编号:25598861 阅读:228 留言:0更新日期:2020-09-11 23:56
本发明专利技术属于深度学习领域,公开了基于深度学习的多元时间序列多层时空依赖建模方法。本发明专利技术引入新颖的注意力机制对神经网络中不同层提取的时空依赖特征做更加细粒度的处理,本发明专利技术提出的模型由一个堆叠的长短期神经网络‑卷积神经网络(LSTM‑CNN),基于CNN的空间注意力机制,基于CNN的通道注意力机制,时间注意力机制以及自回归组件组成,通过引入多层时空依赖的概念,使用基于CNN的通道注意力机制和基于CNN空间注意力机制来分别关注不同层的时空依赖特征,实现了对冗余信息的过滤以及对预测结果影响更大的特征的有效提取,达到了提高预测结果的目的,在不同领域内的多元时间序列数据上表现优异并且能够扩展到单元时间序列预测的任务上。

【技术实现步骤摘要】
基于深度学习的多元时间序列多层时空依赖建模方法
:本专利技术属于深度学习领域,涉及到基于深度学习的多元时间序列预测的方法,属于深度学习在时间序列数据上的应用。
技术介绍
:多元时间序列普遍存在于各个领域,其本身具有复杂时间特性以及空间特性。通过使用深度学习工具对多元时间序列数据进行时空特征的表征,来预测其未来的发展趋势,在能源消耗、交通流量和空气质量等各个领域具有重要的实际应用价值。为了捕捉多元时间序列固有的时空特性,人们已经提出了各种方法。在传统的时间序列预测方法中,自回归移动平均模型(ARIMA)能够有效的提取序列本身的长期依赖性,但是往往忽略了多元序列的空间相关性,并且ARIMA模型对数据本身的要求也很严格,其只适用于平稳性时序数据。因此,ARIMA模型不适用非平稳性以及多元时间序列预测。基于机器学习的回归方法,如支持向量回归(SVR),在对时间序列进行预测的过程中,SVR将外源序列映射在高维空间中,更加关注于外源序列的空间性而忽视了序列的时间依赖性,并且对于样本非常大的数据来说,映射的高维空间维度更大,SVR的计算成本也随之增大。深度学习的方法适合处理大样本数据并且能够拟合各种复杂函数,良好的内在特性使得其能够挖掘出多元时间序列中复杂的时空特征。现已提出了各种神经网络模型来完成多元时间序列预测任务,基于循环神经网络(RNN)的模型对时间特征的提取受到了很大的关注。尤其是RNN的变体长短期神经网络(LSTM)通过引入门控机制添加外部信息,以便捕获时间序列数据的长期依赖并且缓解了梯度爆炸和消失的问题。LSTM更加关注于序列数据上的时间依赖性,对于多元时间序列来说,多个序列之间的空间联系对预测结果也是极为重要的。近年来,基于注意力机制的神经网络已经被研究人员广泛用于时间序列预测,从不同的研究角度基于不同的时空特征构建注意力机制。例如,长短期时序网络(LSTNet)引入了时间注意力机制,对当前预测结果有更大影响的历史数据将得到更多的关注,同时,LSTNet的循环跳跃组件使其在处理周期性数据方面更胜一筹。然而,在LSTNet的卷积层中,每个变量维度都被平等的对待,因此,在空间特征的捕捉上无法捕捉对当前预测结果影响更大的特征。基于双阶段注意力的循环神经网络(DA-RNN)在第一个阶段引入时间注意力机制来捕捉外源数据与目标序列的时间相关性,尚未考虑外源数据不同组成部分之间的空间相关性。以上深度学习的方法中未充分的捕捉多元时间序列的时空特征,并且从网络中不同层获得的时空依赖的差异被忽略,这可能导致特征冗余并影响时空相关性的提取,对多元时间序列预测的结果带来不利的影响。
技术实现思路
:本专利技术的目的在于解决当前深度学习在对多元时间序列数据捕捉时空特征来完成预测任务的过程中,忽视了不同层特征之间的差异由此对预测结果带来的影响。据此,本专利技术提出一种解决这个问题的方法-基于深度学习的多元时间序列多层时空依赖建模方法。本专利技术引入三种新颖的注意力机制来对网络中不同层提取的时空特征做更加细粒度的处理。该模型包括一个堆叠的长短期神经网络-卷积神经网络(LSTM-CNN),基于卷积神经网络的空间注意力机制,基于卷积神经网络的通道注意力机制,时间注意力机制以及自回归组件来进行联合训练。堆叠的LSTM-CNN网络利用LSTM捕捉时间序列数据的长期依赖性,而CNN则捕捉多元输入变量之间的空间相关性和短期依赖。考虑到堆叠的LSTM-CNN网络中深层和浅层网络捕捉的时空特性的不同,利用新颖的注意力结构来对其进行更加细粒度的处理。浅层网络捕捉的时空信息更加丰富并且信息在特征图的不同空间中差异很大,所以使用基于CNN的空间注意力机制来处理该部分时空信息,可以更加方便的过滤出冗余信息。深层网络捕捉的时空特性更加抽象,其在不同卷积通道中的差异更大,所以使用基于CNN的通道注意力机制来挖掘出哪个通道的信息对预测结果更加重要。自回归组件的使用主要是捕捉多元时间序列特征中的线性关系并且加强模型的可解释性及鲁棒性。本专利技术的技术方案是:基于深度学习的多元时间序列多层时空依赖建模方法,包括以下步骤:步骤一:原始数据进行预处理,包括以下步骤:(1)对多元时间序列数据进行z-score标准化;(2)引入滑动窗口对多元时间序列数据进行滚动处理,滑动窗口中的值作为属性,下一时刻的值作为标签,其滑动窗口的步长设置为1,滑动窗口的大小根据实际数据性质自行设定;(3)将处理好的数据按照6:2:2的比例分成训练集、验证集和测试集;步骤二:输入训练数据集,训练神经网络模型,包括以下步骤:(1)首先多元时间序列的训练数据Y={y1,y2,...,yT}输入到堆叠的4层LSTM-CNN模型中,依次进入LSTM1、CNN1、LSTM2、CNN2层获取主要的时空依赖特征,将第二层的输出作为浅层提取的时空特征c1,将最后一层的输出作为深层提取的时空特征c2;(2)将浅层提取的时空依赖特征c1输入基于CNN的空间注意力模型中过滤掉冗余信息,首先使用一个不带池化层的卷积层以及Sigmoid函数作为激活函数得到与时空特征图在高度和宽度两个维度相等的空间注意力权重图,然后浅层时空特征图c1与空间注意力权重图做元素积得到带有空间注意力权重的浅层时空特征图c1*;(3)将深层提取的时空依赖特征c2输入基于CNN的通道注意力模型中,首先使用全局平均池化来获得通道特征向量,然后将该通道特征向量输入到两个全连接层(FC1和FC2)中来获得通道注意力权重图,最后对深层时空特征图c2与通道注意力权重图做元素积得到带有通道注意力权重的深层时空特征图c2*;(4)将带有空间注意力权重的浅层时空特征图c1*与带有通道注意力权重的深层时空特征图c2*做特征融合,将特征融合之后的特征输入LSTM3层中得到输出特征h3;(5)将h3输入时间注意力机制中,使用编码器(Encoder)对h3进行特征压缩处理,其中Encoder为全连接层,然后进入SoftMax中获得特征权重向量,将h3与特征权重向量做元素点积获得带权重的输出并作为神经网络部分的输出。(6)将训练数据Y={y1,y2,...,yT}输入自回归模型中,保持输出数据的维度对输入数据维度的敏感性,捕捉多元时间序列的线性特征,并作为自回归模型部分的输出;(7)将神经网络部分捕获的时空特征与自回归模型中捕获的特征进行融合作为整个模型的最后输出;步骤三:使用验证数据进行模型的检测,包括以下步骤:(1)训练数据训练完模型之后,再使用验证数据输入已经训练好的模型中,对验证数据进行误差以及预测分析;(2)比较训练数据以及验证数据的预测误差,判断模型是否过拟合;(3)一旦发现模型出现过拟合的情况,使用早停策略停止模型的训练,保存当前模型作为最佳模型;步骤四:使用测试数据进行预测,包括以下步骤:(1)将测试数据输入保存好的模型中进行预测;(2)输出下一时刻的预测值。相比于现有技术,本专利技术的有益效果为:1.本专利技术引本文档来自技高网
...

【技术保护点】
1.基于深度学习的多元时间序列多层时空依赖建模方法,其特征在于,包括以下步骤:/n步骤一:原始数据进行预处理,包括以下步骤:/n(1)对多元时间序列数据进行z-score标准化;/n(2)引入滑动窗口对多元时间序列数据进行滚动处理,滑动窗口中的值作为属性,下一时刻的值作为标签,其滑动窗口的步长设置为1,滑动窗口的大小根据实际数据性质自行设定;/n(3)将处理好的数据按照6:2:2的比例分成训练集、验证集和测试集;/n步骤二:输入训练数据集,训练神经网络模型,包括以下步骤:/n(1)首先多元时间序列的训练数据Y={y

【技术特征摘要】
1.基于深度学习的多元时间序列多层时空依赖建模方法,其特征在于,包括以下步骤:
步骤一:原始数据进行预处理,包括以下步骤:
(1)对多元时间序列数据进行z-score标准化;
(2)引入滑动窗口对多元时间序列数据进行滚动处理,滑动窗口中的值作为属性,下一时刻的值作为标签,其滑动窗口的步长设置为1,滑动窗口的大小根据实际数据性质自行设定;
(3)将处理好的数据按照6:2:2的比例分成训练集、验证集和测试集;
步骤二:输入训练数据集,训练神经网络模型,包括以下步骤:
(1)首先多元时间序列的训练数据Y={y1,y2,...,yT}输入到堆叠的4层LSTM-CNN模型中,依次进入LSTM1、CNN1、LSTM2、CNN2层获取主要的时空依赖特征,将第二层的输出作为浅层提取的时空特征c1,将最后一层的输出作为深层提取的时空特征c2;
(2)将浅层提取的时空依赖特征c1输入基于CNN的空间注意力模型中过滤掉冗余信息,首先使用一个不带池化层的卷积层以及Sigmoid函数作为激活函数得到与时空特征图在高度和宽度两个维度相等的空间注意力权重图,然后浅层时空特征图c1与空间注意力权重图做元素积得到带有空间注意力权重的浅层时空特征图c1*;
(3)将深层提取的时空依赖特征c2输入基于CNN的通道注意力模型中,首先使用全局平均池化来获得通道特征向量,然后将该通道特征向量输入到两个全连接层(FC1和FC2)中来获得通...

【专利技术属性】
技术研发人员:田泽安黎丽萍潘佳铭李肯立
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1