一种基于时空图神经网络的时间序列数据预测方法技术

技术编号:33303481 阅读:12 留言:0更新日期:2022-05-06 12:11
本发明专利技术公开了一种基于时空图神经网络的时间序列数据预测方法,包括:采集道路车流辆数据,生成时间序列数据,根据传感器的空间特征来生成输入特征,捕捉时间特征来生成时间相似矩阵,然后通过映射生成全局时空相关邻接矩阵,再进一步生成组合时空相关邻接矩阵,将输入特征和组合时空相关邻接矩阵送入图神经网络中提取特征,使用Huber损失函数训练模型,预测车流量分布情况,汇总车流量分布。本发明专利技术能够对采集到的车流辆数据进行实时更新预测,捕捉到不同交通流数据之间潜在的时间和空间联系,获取道路交通网络的全局信息,用于智能交通系统的监测和管理,此方法具有耗时低、计算复杂度小、实时性高、准确率高的优点,并且适用于其他的时空预测任务。于其他的时空预测任务。于其他的时空预测任务。

【技术实现步骤摘要】
一种基于时空图神经网络的时间序列数据预测方法


[0001]本专利技术涉及深度学习、时空预测以及图神经网络的
,尤其涉及一种基于时空图神经网络的时间序列数据预测方法。

技术介绍

[0002]时空预测是当前人工智能研究的一大热点,针对时空数据的气象预报、洪水预报、股票预测等在日常生活和生产中得到了广泛应用,尤其是在智能交通系统(ITS)领域中交通预测得到了广泛的应用。
[0003]近年来,随着图神经网络的蓬勃兴起,其在交通预测中的应用取得了一定的进展。例如STGCN、ASTGCN、Graph WaveNet和STSGCN等网络均使用图神经网络来构建空间和时间模型,捕捉各自时间序列数据的时间和空间特征。在网络进行特征提取时,分别使用空间和时间邻接矩阵来表示不同节点之间时间和空间的联系,再进行图卷积操作,最后输出预测结果。然而,现有的方法和模型都有其局限性:(1)日益复杂的道路交通结构给提取空间特征带来了难度;(2)单独生成时间和空间的邻接矩阵来捕捉节点特征忽视了节点之间时间和空间上的联系;(3)交通流数据复杂多变,对于同步、动态地捕捉它们的全局特征是非常困难。
[0004]目前在时空预测方面,由于数据量大、准确度和实时性要求高,现有的网络模型和邻接矩阵特征提取方法并不适用。
[0005]所以需要一个新的技术方案来解决这些问题。

技术实现思路

[0006]专利技术目的:为了克服现有的深度学习网络难以对时间序列数据做到快速精准的预测的问题,提供一种基于时空图神经网络的时间序列数据预测方法,以解决时空预测任务中的数据量大、实时性要求高、准确性要求高的特点。
[0007]技术方案:为实现上述目的,本专利技术提供一种基于时空图神经网络的时间序列数据预测方法,包括如下步骤:
[0008]S1:传感器采集道路车流量数据,对数据进行预处理,生成对应的时间序列数据;
[0009]S2:根据传感器不同的地理位置提取传感器的空间特征来生成输入特征,使用时间相似度算法来捕捉不同时间序列数据之间潜在的时间特征,从而生成时间相似矩阵;
[0010]S3:将时间相似矩阵映射到全局,生成全局时空相关邻接矩阵,再进一步生成组合时空相关邻接矩阵;
[0011]S4:通过设定不同的时间步长,对输入的时间序列数据的时间长度进行截取,再将输入特征与组合时空相关邻接矩阵送入对应的堆叠后的图卷积层进行特征提取,使用Huber损失函数进行反向传播训练模型;
[0012]S5:使用训练好的模型预测下一时间段的时间序列数据,根据预测得到的时间序列数据,输出下一时间段的车流量分布情况并汇总全天的车流量分布。
[0013]进一步地,所述步骤S1具体为:
[0014]A1:在不同的道路口设定传感器来采集一个时间段内通过该段路程的车辆数统计,将数据进行保存,保存的文件中包括采集的初试时间、终止时间和车辆数统计;
[0015]A2:对原始数据进行预处理,生成时间序列数据向量集合V=(v1,v2,

v
n
),其中v
f
(f=1,2,

,n)为第f个传感器采集到的这个月通过的车辆数统计,n为所用的传感器总数。
[0016]进一步地,所述步骤S2具体为:
[0017]B1:每个传感器的编号与它们所在公路编号一致,并且每个传感器的编号都是独一无二的,通过这些编号进一步生成它们的输入特征X;
[0018]B2:对于来自时间序列数据向量集合V=(v1,v2,

v
n
)中的任意两条时间序列数据v
i
和v
j
,计算出它们的时间相似度;
[0019]B3:根据计算得出的时间相似度结果,筛选出相似度最高的两条时间序列数据;
[0020]B4:在时间序列数据向量集合V中任取一条时间序列数据记为v
a
,其中a表示该条时间序列数据在时间序列数据向量集合V中的坐标,当i=a时,求得与v
a
相似度最高的时间序列数据v
b
,构建时间相似矩阵M
sim
,时间相似矩阵M
sim
中(a,b)坐标位置的元素设置为1,遍历整个时间序列数据向量集合,完成M
sim
的构建。
[0021]进一步地,所述步骤B2中通过公式(1),公式(2)和公式(3)计算出时间相似度:
[0022][0023][0024]式中,m表示时间间隔数,M表示时间间隔的总数,m的取值范围从1到M,v
(i,m)
为第i条时间序列数据向量中的第m个时间间隔内统计的车辆数,v
(j,m)
为第j条时间序列数据向量中的第m个时间间隔内统计的车辆数,表示第i条时间序列数据向量的车辆数的平均值,表示第j条时间序列数据向量的车辆数的平均值;
[0025][0026]式中,Correlation(v
i
,v
j
)表示v
i
,v
j
之间的时间相似度。
[0027]进一步地,所述步骤B3中用式(4)筛选出相似度最高的两条时间序列数据:
[0028]max{Correlation(v
i
,v
j
)}#(4)
[0029]式中,max表示求最大值计算。
[0030]进一步地,所述步骤S3具体为:
[0031]C1:将地理位置相邻的传感器在矩阵中用1表示,0则表示它们不相邻,从而得到对应的邻接矩阵A;
[0032]C2:使用与邻接矩阵A相同大小的单位矩阵M
con
来进一步表示每个传感器之间潜在的时间和空间的联系;
[0033]C3:将邻接矩阵A、单位矩阵M
con
和时间相似矩阵M
sim
进一步融合生成全局时空相关邻接矩阵A
cor

[0034]C4:使用两个全局时空相关邻接矩阵A
cor
来生成组合时空相关邻接矩阵A
cor
·
group
,从而进一步扩大时间序列数据的时空特征提取范围。
[0035]进一步地,所述步骤S4具体为:
[0036]D1:以5分钟为一个时间间隔,将一小时平均分成12个时间间隔;
[0037]D2:通过设定时间步长,通过公式(5)依次按12、9、6的时间间隔来截取输入特征X里的时间序列数据,生成3种不同时间间隔的时间序列数据切片:
[0038][0039]式中,h表示图卷积层,l表示层数,l的值为3,input表示输入,output表示输出,表示第l层图卷积层的输入,表示第l

1层图卷积层的输出,T为时间间隔总数,T的值为12,K为组合时空相关邻接矩阵A
cor
·
g本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时空图神经网络的时间序列数据预测方法,其特征在于,包括如下步骤:S1:传感器采集道路车流量数据,对数据进行预处理,生成对应的时间序列数据;S2:根据传感器不同的地理位置提取传感器的空间特征来生成输入特征,使用时间相似度算法来捕捉不同时间序列数据之间潜在的时间特征,从而生成时间相似矩阵;S3:将时间相似矩阵映射到全局,生成全局时空相关邻接矩阵,再进一步生成组合时空相关邻接矩阵;S4:通过设定不同的时间步长,对输入的时间序列数据的时间长度进行截取,再将输入特征与组合时空相关邻接矩阵送入对应的堆叠后的图卷积层进行特征提取,使用Huber损失函数进行反向传播训练模型;S5:使用训练好的模型预测下一时间段的时间序列数据,根据预测得到的时间序列数据,输出下一时间段的车流量分布情况并汇总全天的车流量分布。2.根据权利要求1所述的一种基于时空图神经网络的时间序列数据预测方法,其特征在于,所述步骤S1具体为:A1:在不同的道路口设定传感器来采集一个时间段内通过该段路程的车辆数统计,将数据进行保存,保存的文件中包括采集的初试时间、终止时间和车辆数统计;A2:对原始数据进行预处理,生成时间序列数据向量集合V=(v1,v2,

v
n
),其中v
f
(f=1,2,

,n)为第f个传感器采集到的这个月通过的车辆数统计,n为所用的传感器总数。3.根据权利要求2所述的一种基于时空图神经网络的时间序列数据预测方法,其特征在于,所述步骤S2具体为:B1:每个传感器的编号与它们所在公路编号一致,并且每个传感器的编号都是独一无二的,通过这些编号进一步生成它们的输入特征X;B2:对于来自时间序列数据向量集合V=(v1,v2,

v
n
)中的任意两条时间序列数据v
i
和v
j
,计算出它们的时间相似度;B3:根据计算得出的时间相似度结果,筛选出相似度最高的两条时间序列数据;B4:在时间序列数据向量集合V中任取一条时间序列数据记为v
a
,其中a表示该条时间序列数据在时间序列数据向量集合V中的坐标,当i=a时,求得与v
a
相似度最高的时间序列数据v
b
,构建时间相似矩阵M
sim
,时间相似矩阵M
sim
中(a,b)坐标位置的元素设置为1,遍历整个时间序列数据向量集合,完成M
sim
的构建。4.根据权利要求3所述的一种基于时空图神经网络的时间序列数据预测方法,其特征在于,所述步骤B2中通过公式(1),公式(2)和公式(3)计算出时间相似度:在于,所述步骤B2中通过公式(1),公式(2)和公式(3)计算出时间相似度:式中,m表示时间间隔数,M表示时间间隔的总数,m的取值范围从1到M,v
(i,m)
为第i条时间序列数据向量中的第m个时间间隔内统计的车辆数,v
(j,m)
为第j条时间序列数据向量中的第m个时间间隔内统计的车辆数,表示第i条时间序列数据向量的车辆数的平均值,表示第j条时间序列数据向量的车辆数的平均值;
式中,Correlation(v
i
,v
j
)表示v
i
,v
j
之间的时间相似度。5.根据权利要求3所述的一种基于时空图神经网络的时间序列数据预测方法,其特征在于,所述步骤B3中用式(4)筛选出相似度最高的两条时间序列数据:max{Correlation(v
i<...

【专利技术属性】
技术研发人员:谢非杨嘉乐张瑞凌旭李群召刘畅郑鹏飞夏光圣章悦
申请(专利权)人:南京师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1