一种基于时空图卷积网络的交通流量预测方法技术

技术编号:37359367 阅读:9 留言:0更新日期:2023-04-27 07:08
本发明专利技术提出了一种基于时空图卷积网络的交通流量预测方法,旨在解决交通速流量预测中数据高维、非线性、不确定性等难以解决的问题。所提出的预测模型包括全连接神经网络层、时空卷积块和一维卷积层。交通流量数据经过全连接层后进入时空卷积块,以捕获流量数据的时间特征与空间特征。最后,时空卷积块的结果输入一维卷积层得到最后的预测结果。时空卷积块包括时间卷积网络层、时间注意力层、图卷积层、门控融合层。时间卷积网络层与时间注意力层用于捕获交通流量不同尺度的时间特征,图卷积层用于动态捕获空间特征,门控融合层用于融合不同尺度的特征矩阵。时空卷积块动态捕获了交通流量不同尺度的时空特征且筛选了重要的部分,提高了预测精度。了预测精度。了预测精度。

【技术实现步骤摘要】
一种基于时空图卷积网络的交通流量预测方法


[0001]本专利技术涉及一种基于时空图卷积网络的交通流量预测方法。

技术介绍

[0002]随着城市化进程的不断推进,城市交通流量的预测越来越受到人们的关注。交通流量的预测可以为城市交通管理提供有力的支持,如优化交通信号控制、提高交通运输效率等。传统的交通流量预测方法大多采用时间序列预测模型,但由于交通流量数据的高维、非线性和不确定性等特点,这些方法往往难以准确预测交通流量。近年来,深度学习技术在交通流量预测方面取得了较好的效果,尤其是基于图卷积网络(Graph Convolutional Networks,GCN)的方法的预测精度取得了很大的提示,受到国内外学者的广泛关注。
[0003]随着智能交通系统的提出和发展,各大城市和高速公路都部署了大量传感器等信息收集设备。这些设备能收集大量交通流量数据和地理位置信息,为交通流量预测提供了大量的可靠数据。
[0004]交通流量数据是一种典型的时空数据,由于交通流量数据同时具有时间特征与空间特征,因此交通流量预测的难点在于动态地提取时间特征与空间特征。在时间特征提取方面,传统的预测方法基于线性假设通过找出历史交通流量数据的线性规律来进行预测,然而真实交通流量的演变是非线性且非平稳的,所以传统预测方法的预测精度不佳。近年,基于深度学习的循环神经网络(Recurrent Neural Networks,RNN)、长短期记忆网络(Long Short

Term Memory,LSTM)、时间卷积网络(Temporal Convolutional Network,TCN)能够对时序数据进行建模并取得了较好的预测效果。上述深度神经网络结合图卷积神经网络(Graph Convolutional Neural Networks,GCN)的使得交通流量预测模型的效果进一步提升。当前收集的交通数据量能够满足深度学习的数据要求,使用深度学习方法能从数据中挖掘到深层次的时空特征提高预测精度。
[0005]具体地,给定一个长度为T
h
的历史交通信号矩阵交通流量预测的目标是建立一个模型将X作为输入然后输出未来T

个时间步的交通流量矩阵Y
pre
∈R
N
×
T
′×
c
。其中N表示交通路网节点数量,C表示交通特征数量,如果仅仅将交通流量数据输入模型则C=1。

技术实现思路

[0006]本专利技术的目的是提供一种基于时空图卷积网络的交通流量预测方法,可以捕获交通流量数据深层的时间特征与空间特征,提高预测精度。
[0007]本专利技术解决上述问题的技术方案如下:一种基于时空图卷积网络的交通流量预测方法,其特征在于:利用时空卷积块捕获交通流量的时间特征与空间特征;在时空卷积块中包含时间卷积网络与时间注意力层,其目的在于从不同尺度捕获交通流量的时间特征;在时空卷积块中使用图卷积网络捕获交通流量的空间特征;在时空卷积块中使用门控融合层将具有不同尺度的时空特征的交通流量特征矩阵进行融合;使用一维卷积网络作为预测层
输出预测结果。
[0008]本专利技术提供的这种基于时空图卷积网络的交通流量预测方法,过程如下:
[0009]步骤1:获取原始数据集并对其进行预处理,得到训练集、验证集、测试集。
[0010]步骤2:基于图卷积网络(Graph convolution neural network,GCN)、时间卷积网络(Temporal Convolutional Network,TCN)、注意力机制(Attention mechanism)、一维卷积神经网络(Convolutional Neural Network,CNN)构建交通流量预测模型。
[0011]步骤3:使用步骤1获得的训练集、验证集输入步骤2中构建的交通流量预测模型进行训练、评估。
[0012]步骤4:使用步骤3训练后的交通流量预测模型对步骤1中得到的测试集数据进行交通流量预测,并采用平均绝对误差(mean absolute error,MAE),均方根误差(root mean square error,RMSE)和平均绝对百分比误差(mean absolute percentage error,MAPE)作为评估标准。
[0013]步骤1所述的交通数据预处理,具体过程如下:
[0014]1)收集目标区域交通数据采集装置采集的数据;检查数据完整性情况、利用线性插值替换或填充异常数据并按照每5分钟聚合一次将数据处理成大小为N
×
T的交通流量矩阵;其中N表示交通路网中数据采集点数量,T表示时间点数量。
[0015]2)对1)中得到的交通流量矩阵进行标准化,得到标准化的交通流量矩阵。
[0016]3)将2)中得到的标准化交通流量矩阵划分成训练集、验证集、测试集。具体地,将60%的数据划分为训练集,20%划分为验证集,剩余20%划分为测试集。
[0017]步骤2所述的基于图卷积网络、时间卷积网络、注意力机制等构建交通流量预测模型,具体步骤如下:
[0018]交通流量预测模型包括:两个串联的全连接层、三个串联的时空卷积块、以及一维卷积神经网络层。时空卷积块的作用是捕获交通流量数据的时空特征;时空卷积块中包含时间卷积网络层、时间注意力层、图卷积层和门控融合层。其中,时间卷积网络层和时间注意力层分别从不同尺度捕获交通流量数据的时间特征,图卷积层动态捕获交通流量数据的空间特征,门控融合层用来融合具有不同尺度的时空特征的交通流量特征矩阵。一维卷积神经网络作为预测层输出最终的预测数据。
[0019]1)上述全连接层公式表达如式(1)。X

=sigmoid(WX+B)
ꢀꢀꢀꢀ
(1)
[0020]其中sigmoid为非线性激活函数,W和B表示可学习的权重矩阵和偏置向量。
[0021]2)所述的使用时间卷积网络层与时间注意力层从不同尺度捕获交通流量数据的时间相关性,具体如下:
[0022]时间卷积网络层中采用空洞卷积利用多层卷积网络捕获交通流量的局部时间特征,其中每一层卷积神经网络拥有多个卷积核大小为(1
×
k),并且在每个卷积网络层中都使用残差连接和标准化层。具体地公式如下,h
l
=Relu(W
l
*h(
l
‑1)+b
l
)
ꢀꢀꢀꢀ
(2)
[0023]其中,h
l
表示第l个卷积网络层提取到的特征矩阵,最初的特征矩阵由全连接层得到,即h0=X

;*是一维卷积操作,卷积核大小为(1
×
k);W
l
和b
l
表示可学习的权重矩阵和偏置向量;Relu是非线性激活函数。
[0024]在时空卷积块中通过串联多个时间卷积网络层捕本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时空图卷积网络的交通流量预测方法,其特征在于:网络结构包括全连接层、多个串联且带有残差连接的时空卷积块、一维卷积层,其中时空卷积块中包括多层堆叠的时间卷积层与时间注意力层、图卷积层与门控融合层。所述交通流量预测方法,具体过程如下:步骤1:对原始交通流量数据预处理,输出预处理完成后的交通流量信号矩阵X∈R
N
×
T
,其中N表示交通路网的节点数量,T为交通流量的采集数量。步骤2:将步骤1处理后的交通流量数据输入两个串联的全连接层中,定义为式(1)。X

=sigmoid(WX+B)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,X为交通流量数据矩阵,X

为经过全连接层后的交通流量矩阵;W与B为可学习的权重矩阵与偏置向量,sigmoid()是非线性激活函数。步骤3:基于步骤2的输出提取交通流量数据的时空特征。这一步骤由时空卷积块完成,公式表达如下:其中,STB表示时间卷积块;A为交通路网中节点拓扑图的邻接矩阵,D是A的度矩阵,是时空卷积块第一次捕获到的交通流量特征矩阵。步骤4:基于步骤3输出的带有时空特征的交通流量矩阵,进一步捕获更深层次的时空特征。注意,该过程可重复捕获多次,每一次的输出可作为下一次捕获的输入,如式(3)所示。其中,i表示重复捕获的次数,表示第i次捕获时空特征后的交通流量特征矩阵。步骤5:步骤1处理过后的交通流量数据经过步骤2、步骤3和步骤4的特征提取后最后经过一层一维卷积层得到未来T
h
个时间步的预测结果。T
h
是根据需求人为设定的预测时间步数量。2.根据权利要求1所述的一种基于时空图卷积网络的交通流量预测方法,其特征在于:步骤1中的数据预处理包括对原始数据丢失或异常部分进行线性插值、将原始数据归一化、根据交通网络中各个节点的地理距离计算预定义邻接矩阵以及将数据划分成训练集、验证集和测试集。具体来说,将60%划分为训练集,20%的数据划分为验证集,20%的数据划分为测试集。基于地理距离的预定义邻接矩阵的计算方式如式(4):其中,dis(i,j)表示交通节点i和j之间的距离;τ∈(0,0.1)是根据具体情况人工设置的阈值。3.根据权利要求1所述的一种基于时空图卷积网络的交通流量预测方法,其特征在于:步骤2中涉及的时空卷积块中包括时间卷积网络与时间注意力层。时间卷积网络的核心在于通过空洞卷积捕获交通流量细粒度的时间特征。具体来说,时间卷积网络包含l层卷积网
络层,每个卷积网络层包括多个大小为(1
×
k)的卷积核,且在每个卷积网络层之间使用残差连接和一个标准化层。时间卷积网络中第l层卷积层的输出h
l
表示为式(5)。h
l
=Relu(W
l
*h
(l

1)
+b
l
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中*表示卷积操作,卷积核大小为(1
×
k),卷积数量为m;W
l
∈R
m
×
d
×
k
表示第l层卷积层的卷积核权重,b
l
∈R
m
是偏置向量;Relu表示激活函数;d是卷积层的输出通道数量。第一个卷积层的输入为权利要求1中步骤2处理后的交通流量矩阵X

,即h0=X

;h
l
为表示第l

1层卷积层输出的特征矩阵,也即时间卷积网络层输出的局部时间特征矩阵。时间注意力层用于捕获非相邻时间点之间的全局时间特征,使用缩放点积注意力实现,如式(6)所示。Q=W
Q
·
...

【专利技术属性】
技术研发人员:姜聪宋云邓泽林范文东罗雨
申请(专利权)人:湖北武荆高速公路发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1