基于长短期时空数据多图融合时空注意力的数据预测方法技术

技术编号:28465332 阅读:27 留言:0更新日期:2021-05-15 21:31
本发明专利技术公开了一种基于长短期时空数据多图融合时空注意力的数据预测方法,包括以下步骤:获取站点交通流量的时空数据,并按预设时间间隔划分为时隙进行流量统计;构建图节点,并基于图节点构造站点间距离图、城市功能区图、站点邻接图;每个图节点代表一个站点;对三个图进行多图融合卷积运算;利用多图融合卷积算子替换GRU中的矩阵乘法构建GRU变体MFCRNN;计算各站点间的实时客流模式相似度,基于注意机制捕获站点间的空间动态相关性;结合MFCRNN和空间注意力机制构造AMFCRNN算子;采用编解码结构实现客流多步预测。本发明专利技术的方法能够进行更准确的城市公共交通客流预测,且可适用于不同类型的公共交通数据集。不同类型的公共交通数据集。不同类型的公共交通数据集。

【技术实现步骤摘要】
基于长短期时空数据多图融合时空注意力的数据预测方法


[0001]本专利技术属于流量预测领域,特别是一种基于长短期时空数据多图融合时空注意力的数据预测方法。

技术介绍

[0002]公共交通客流预测作为智能交通系统的重要组成部分,在城市交通网络规划、公共交通调度和城市管理以及人们的日常生活中发挥着重要作用。例如,交通客流预测不仅能为旅客提供位置推荐、导航等智能交通服务,也可以为交通管理者提供车辆调度依据。此外,自动收费系统(AFC)收集了大量的乘客出行信息,为公共交通客流预测提供了数据驱动。
[0003]然而,站点间复杂的时间和空间依赖性使得实时准确的交通客流预测变得更加困难。空间上,不同的站点位于城市不同功能区,客流模式受城市功能用地的影响;相邻或距离较近的站点之间存在客流交互现象;同时站点间的空间相关性随着时间的推移也会发生改变,仅考虑空间静态相关性不足以对空间进行理想建模。在时间依赖性方面,城市交通枢纽(如地铁车站)的客流随时间动态变化,呈现周期性和趋势,同时受天气、温度等因素的影响。这些挑战使得准确的进行交通客流预测变得更为困难。
[0004]传统的交通流预测模型可以分为统计模型和浅层机器学习模型。统计模型包括基于自回归移动平均模型(ARIMA),历史平均(HA)和卡尔曼滤波模型。然而,统计模型通常依赖于线性假设,不能反映交通流的非线性特征。浅层机器学习方法可以从交通数据和外部因素中学习非线性规律,如,k近邻模型和贝叶斯模型。然而,浅层机器学习方法依赖于特征工程,对于复杂规律和复杂因素的预测任务,它们通常不能产生最佳的结果。
[0005]近年来,基于深度学习的交通流预测模型表现出色。基于深度学习的模型可以自动进行特征提取并捕获数据相关性,不再需要手动选择特征。由于交通流数据是时序数据,准确捕捉其时间相关性对建模至关重要,因此,RNN、GRU和LSTM在客流预测、交通时间和交通速度等各种交通态势预测中得到了广泛的应用。许多研究者将卷积神经网络(CNN)与RNN结合起来,同时建模时空相关性。卷积神经网络虽然捕获了部分空间相关性,但忽略了空间多重静态相关性。为了捕获较为完整的空间相关性,将图卷积(GCN)引入交通流领域。如文献《T

GCN:A Temporal Graph Convolutional Network for Traffic Prediction》利用图卷积学习复杂的拓扑结构以捕获空间相关性,使用门控递归单元学习交通数据的动态变化以捕获时间相关性。文献《Spatiotemporal graph convolutional networks:A deep learning framework for traffic forecasting》基于路网结构构造时空卷积块,只利用图卷积及卷积神经网络建模交通流时空相关性。文献《An effective spatial

temporal attention based neural network for traffic flow prediction》基于路网结构捕获欧氏空间相关性,同时利用注意力机制捕获空间动态相关性。上述这些方法虽然考虑了交通网络的拓扑结构,但都只针对单一的静态结构,而忽略了空间多重静态相关性及动态相关性。

技术实现思路

[0006]本专利技术的目的在于针对上述现有技术存在的问题,提供一种基于长短期时空数据多图融合时空注意力的数据预测方法,适用于城市交通数据集,实现更完整的空间相关性提取,更好地反映客流的时空相关性,推断未来时刻不同天气环境下各站点多步长客流。
[0007]实现本专利技术目的的技术解决方案为:一种基于长短期时空数据多图融合时空注意力的数据预测方法,所述方法包括以下步骤:
[0008]步骤1,获取站点交通流量的时空数据,并按预设时间间隔划分为时隙进行流量统计;
[0009]步骤2,构建图节点,并基于图节点构造站点间距离图、城市功能区图、站点邻接图;每个图节点代表一个站点;
[0010]步骤3,对步骤2中的三个图进行多图融合卷积运算;
[0011]步骤4,利用多图融合卷积运算替换GRU中的矩阵乘法构建GRU变体MFCRNN;
[0012]步骤5,计算各站点间过去K个时隙的客流模式相似度,基于空间注意机制捕获站点间的空间动态相关性;
[0013]步骤6,结合GRU变体MFCRNN和空间注意力机制构造AMFCRNN算子;
[0014]步骤7,采用编解码结构实现客流多步预测,其中解码器为AMFCRNN算子。
[0015]本专利技术与现有技术相比,其显著优点为:1)在站点复杂的空间相关关系中,构造站点间距离图、城市功能区图、站点邻接图并进行多图融合图卷积操作,对空间多重静态相关性进行更完整的提取;2)针对站点间的空间动态相关性,构建了空间注意力机制,能够挖掘站点间随着时间的推移而改变的空间关系;3)针对长输入序列存在的信息丢失问题,使用时间注意力机制自动给较重要的输入时隙赋予更大的权重;4)同时使用了短期及长期历史客流数据,可以更好的提取客流趋势性及周期性;5)能够适用于不同类型的公共交通数据集,如公交数据集、地铁数据集、共享单车数据集等。
[0016]下面结合附图对本专利技术作进一步详细描述。
附图说明
[0017]图1为基于长短期时空数据多图融合时空注意力的数据预测方法流程图。
[0018]图2为一个实施例中算法误差对比图,其中图(a)为本专利技术与对比模型在MAE上的性能对比,图(b)为本专利技术与对比模型在RMSE上的性能对比。
[0019]图3为一个实施例中算法误差对比图,其中图(a)为本专利技术与单图模型在MAE上的性能对比,图(b)为本专利技术与单图模型在RMSE上的性能对比。
[0020]图4为一个实施例中预测值与真实值对比图。
[0021]图5为一个实施例中多种方法预测值与真实值对比图。
具体实施方式
[0022]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0023]现有方法虽然考虑了交通网络的拓扑结构,但都只针对单一的静态结构,而忽略
了空间多重静态相关性及动态相关性。因此,本专利技术将通过构建站点距离图、城市功能相似性图、站点邻接图进行多图融合卷积可捕获空间多重静态相关性,基于空间注意力机制获取空间动态相关性。
[0024]在一个实施例中,提供了一种基于长短期时空数据多图融合时空注意力的数据预测方法,所述方法包括以下步骤:
[0025]步骤1,获取站点交通流量的时空数据,并按预设时间间隔划分为时隙进行流量统计;
[0026]这里,所述交通流量时空数据包括:刷卡数据、天气信息、站点经纬度信息,及城市兴趣点相关信息,包括兴趣点名称、所在经纬度、兴趣点类型等。
[0027]步骤2,构建图节点,并基于图节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于长短期时空数据多图融合时空注意力的数据预测方法,其特征在于,所述方法包括以下步骤:步骤1,获取站点交通流量的时空数据,并按预设时间间隔划分为时隙进行流量统计;步骤2,构建图节点,并基于图节点构造站点间距离图、城市功能区图、站点邻接图;每个图节点代表一个站点;步骤3,对步骤2中的三个图进行多图融合卷积运算;步骤4,利用多图融合卷积运算替换GRU中的矩阵乘法构建GRU变体MFCRNN;步骤5,计算各站点间过去K个时隙的客流模式相似度,基于空间注意机制捕获站点间的空间动态相关性;步骤6,结合GRU变体MFCRNN和空间注意力机制构造AMFCRNN算子;步骤7,采用编解码结构实现客流多步预测,其中解码器为AMFCRNN算子。2.根据权利要求1所述的基于长短期时空数据多图融合时空注意力的数据预测方法,其特征在于,步骤1中所述交通流量时空数据包括:刷卡数据、天气信息、站点经纬度信息,及城市兴趣点相关信息,包括兴趣点名称、所在经纬度、兴趣点类型。3.根据权利要求1或2所述的基于长短期时空数据多图融合时空注意力的数据预测方法,其特征在于,步骤2中所述构建图节点,具体为:提取站点的天气、日期信息,之后与时隙流量进行拼接,形成图节点特征,图节点记为X∈R
N
×
P
,其中N表示站点个数,P表示图节点特征维度;基于前K个时隙的短期历史客流数据,短期数据序列输入表示为X
(t

K+1)
,X
(t

K+2)
,...,X
(t)
;根据前p天长期历史客流数据构造输入序列其中为客流预测步长,m≥0。4.根据权利要求3所述的基于长短期时空数据多图融合时空注意力的数据预测方法,其特征在于,步骤2中所述站间距离图具体为:图节点之间的边权重由站点之间的距离确定,该图的邻接矩阵为:式中,为邻接矩阵A
d
∈R
N
×
N
中(i,j)处的值,dist(v
i
,v
j
)表示站点i与站点j之间的距离,σ表示距离标准差,Th
d
为设定的距离阈值以便控制A
d
的稀疏性;所述城市功能区图具体为:图节点之间的边权重由站点间不同类别兴趣点POIs的数量所组成的向量的相似性确定,该图的邻接矩阵为:其中,
式中,为邻接矩阵A
p
∈R
N
×
N
中(i,j)处的值,P
h,i
,P
h,j
分别表示站点v
i
,v
j
的POIs向量,H表示POIs的类别数,为所有站点在该维度的均值,使用阈值Th
p
调整A
p
的稀疏性;所述站点邻接图具体为:图节点之间的边权重由两站点是否相邻确定,该图的邻接矩阵为:式中,为邻接矩阵A
s
∈R
N
×
N
中(i,j)处的值。5.根据权利要求4所述的基于长短期时空数据多图融合时空注意力的数据预测方法,其特征在于,步骤3所述对步骤2中的三个图进行多图融合卷积运算,具体过程包括:步骤3

1,对每张图的邻接矩阵A进行归一化处理:其中,其中,其中,式中,I
N
为单位矩阵,表示在A的基础上增加了自环,为度矩阵,|V|表示站点数量,为添加了自环的归一化邻接矩阵;步骤3

2,进行多图融合,融合公式为:式中,W
′1,W
′2,...W

N
=softmax(W1,W2,...,W
N
),1≤i≤M,M表示待融合的图的总数,表示哈达玛乘法,W1,W2,...,W
N
为可学习到的参数,A
F
∈R
N
×
N
为多图融合的结果;步骤3

3,对融合后的结果进行一阶近似切比雪夫多项式图卷积运算,计算公式为:式中,为第l+1层图卷积的输出,为第l层图卷积的输出,W
(l)
为第l层的参数。6.根据权利要求5所述的基于长短期时空数据多图融合时空注意力的数据预测方法,其特征在于,步骤4中所述GRU变体MFCRNN为:
H
(t)
=u
(t)

H
(t

1)
+(1

u
(t)
)

C
(t...

【专利技术属性】
技术研发人员:顾晶晶马敬艳
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1