当前位置: 首页 > 专利查询>河南大学专利>正文

一种基于强化时空图神经网络的交通预测方法技术

技术编号:27107834 阅读:39 留言:0更新日期:2021-01-25 18:59
本发明专利技术提供一种基于强化时空图神经网络的交通预测方法,基于序列到序列模型的交通预测框架,对道路网络的时间相关性、空间相关性进行建模,根据道路网络上下游关系将整个路网构建成一个有向加权图,通过扩散图卷积网络来捕获路网的空间相关性,提取路网的空间相关性特征,将带有空间相关性特征的时间序列输入到递归神经网络中捕获路网的时间相关性,然后通过强化学习中的actor

【技术实现步骤摘要】
一种基于强化时空图神经网络的交通预测方法


[0001]本专利技术属于交通预测
,具体涉及一种基于强化时空图神经网络的交通预测方法。

技术介绍

[0002]现有随着智能交通系统的迅速发展,交通预测越来越受到人们的关注,它是交通管理系统的重要组成部分,是实现交通规划、交通管理和交通控制的重要组成部分。交通预测不仅可以为交通管理者提前感知交通拥堵、限制车辆提供科学依据,还可以帮助出行者选择合适的出行路线,从而提高出行效率。然而道路网络中复杂的时空相关性使交通预测变得复杂。
[0003]现有的交通预测方法有很多,所用到的道路上的传感器包括环形线圈车辆检测器、视频车辆检测器、红外传感器等,经典的自回归综合移动平均模型、卡尔曼滤波模型、支持向量机模型等方法繎取得了一定的效果,但它们都只考虑了交通状况随时间的动态变化,而忽略了路网中的空间相关性,使预测的交通状况不受路网拓扑结构的影响。为了在预测过程中加入空间特征的影响,研究人员开始引入卷积神经网络来对空间相关性进行建模。然而卷积神经网络通常用于图像、规则网格等欧式数据,无法捕获复杂的路网拓扑结构,因此在本质上无法描述空间相关性。随着图神经网络的发展,时空图建模也引起了研究人员的关注。交通数据由路网中固定位置的传感器记录下来,将这些传感器构建成一个图网络,边缘由两个节点之间的距离确定,同一节点不同时间的交通数据不仅受到其历史数据的影响,还受邻近节点的影响。因此有效提取数据的时空相关性是解决这一问题的关键。
[0004]虽然现有的基于深度模型的交通预测模型已经取得了较高的预测精度,但仍存在一些待解决的问题。大多数现有的方法依赖于经典的序列到序列架构(Seq2Seq),将历史时间序列输入至编码器并使用其最终状态初始化解码器来进行预测。然而经典的Seq2Seq模型在训练过程中的训练损失由传感器采集的真实样本来监督,然而在测试时没有真实样本,解码器完全依赖模型自身的生成的输出来预测下一个输出,这会导致模型在训练和测试过程中产生的下一个动作存在差异,而在这个过程中产生的误差会不断累积,这种差异又称为曝光误差(Exposure Bias)。虽然也出现了计划采样、对抗生成网络等方法用于避免曝光误差,但这些方法都存在一些弊端,因此有效地避免曝光误差对提高预测精度来说是十分必要的。

技术实现思路

[0005]本专利技术的目的是提供一种基于强化时空图神经网络的交通预测方法,提高预测精度。
[0006]本专利技术解决其技术问题的技术方案为:一种基于强化时空图神经网络的交通预测方法,包括以下步骤,
[0007]S1:对某一时间段内传感器采集到的原始交通数据进行预处理;
[0008]S2:将预处理后的数据集分为用于训练模型的训练集、用于验证模型的训练结果的验证集、用于对训练完成的模型进行测试的测试集;
[0009]S3:根据传感器之间的邻接关系构建有向加权道路网络结构拓扑图G=(V,E,A),其中V为所有传感器节点的集合,E为边的集合,即相邻传感器节点之间的连接关系,A为路网拓扑图的邻接矩阵,将预处理后的数据集中的交通信息(即交通速度信息)作为节点的属性特征,用X表示G中节点的特征矩阵;
[0010]S4:通过路网拓扑图的邻接矩阵A和有向加权道路网络结构拓扑图G中节点的特征矩阵X构建序列到序列的图神经网络模型,通过序列到序列的图神经网络模型:
[0011]S4.1:通过路网拓扑图的邻接矩阵A和有向加权道路网络结构拓扑图G中节点的特征矩阵X建立K阶扩散图卷积DGC,在路网上用K阶扩散图卷积DGC来建模路网的空间相关性,通过随机游走捕获路网中各传感器节点上下游交通状况对该传感器节点的影响,也即路网的空间相关性;
[0012]S4.2:通过嵌入扩散图卷积和门控递归单元GRU构建时空数据编码器,将带有空间特征的时间序列输入到门控递归单元GRU来提取交通数据之间的时间相关性,从而得到路网的时空相关性;
[0013]S4.3:计算编码器内各历史时间步长的时空隐藏状态,然后将编码器的最后一个隐藏状态作为解码器的输入;
[0014]S4.4:在编码器中加入注意力机制,计算编码器的上下文向量c;
[0015]S4.5:在解码器中使用actor-critic算法对模型的策略参数进行优化;
[0016]S5:训练模型,用平均相对误差MRE作为损失函数;并在验证集和测试集中对模型进行验证、测试。
[0017]S6:在测试集中,将特征矩阵X及路网拓扑图输入到训练好的模型中来预测未来的交通状况,并评估图神经网络模型的性能。
[0018]所述步骤S1中预处理的过程为以5分钟为间隔通过道路周围的传感器来采集交通数据,提取交通数据样本的特征,通过滤波、归一化对原始数据进行处理,剔除无效的数据,得到时间序列数据;获得传感器的位置信息(经度、纬度),并对所有传感器节点进行编号,通过传感器的位置信息计算相邻传感器节点之间的距离。
[0019]所述步骤S2中训练集中的数据占总数据的70%,验证集中的数据占总数据的10%,测试集中的数据占总数据的20%。
[0020]所述步骤S2中的邻接矩阵A∈R
N
×
N
,其中A
ij
为邻接矩阵A中第i行,第j列的元素,若传感器节点i与传感器节点j相邻,则A
ij
=1,否则A
ij
=0;
[0021]G中节点的特征矩阵X∈R
N
×
P
,P表示节点属性特征的数量,N表示传感器节点的个数。
[0022]所述的步骤S4.1中的K阶扩散图卷积为:其中Do-1
A,D
I-1
A
T
分别表示转移矩阵及其逆矩阵,θ∈R
K
×2为滤波器的参数,x为X中的一个元素,是单个时间片对应的特征矩阵,根据扩散图卷积构建扩散卷积层来捕获空间相关性。
[0023]所述的步骤S4.4中在序列到序列模型中加入注意力机制,注意力机制的具体计算
过程为:计算第i个输入对第j个输出的影响权重,即注意力分值:e
ij
=tanh(h
i-1
,h
j
),为了便于比较不同输入对同一输出的权重系数,通过softmax函数对所有输入的注意力分值进行归一化;
[0024]所述的步骤S4.5中将整个预测过程看作一个连续的马尔可夫决策过程MDP,一个智能体在离散时间步长T'时与环境进行交互,令M=(S,A,P,R,s
o
,γ,T),将所有传感器组成的路网拓扑结构作为智能体,门控递归单元GRU作为智能体选择下一个动作(输出)的随机策略,则S为解码器隐藏状态的集合,A为智能体选择的动作集合,P为状态转移概率矩阵,R为奖励函数,s
o
为初始状态,γ为折扣因子,T为时间步;
[0025]所述的智能体与环境交互的目标是最大化优势函数,即
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强化时空图神经网络的交通预测方法,其特征在于:包括以下步骤,S1:对某一时间段内传感器采集到的原始交通数据进行预处理;S2:将预处理后的数据集分为用于训练模型的训练集、用于验证模型的训练结果的验证集、用于对训练完成的模型进行测试的测试集;S3:根据传感器之间的邻接关系构建有向加权道路网络结构拓扑图G=(V,E,A),其中V为所有传感器节点的集合,E为边的集合,即相邻传感器节点之间的连接关系,A为路网拓扑图的邻接矩阵,将预处理后的数据集中的交通信息作为节点的属性特征,用X表示G中节点的特征矩阵;S4:通过路网拓扑图的邻接矩阵A和有向加权道路网络结构拓扑图G中节点的特征矩阵X构建序列到序列的图神经网络模型,通过序列到序列的图神经网络模型:S4.1:通过路网拓扑图的邻接矩阵A和有向加权道路网络结构拓扑图G中节点的特征矩阵X建立K阶扩散图卷积DGC,在路网上用K阶扩散图卷积DGC来建模路网的空间相关性,通过随机游走捕获路网中各传感器节点上下游交通状况对该传感器节点的影响,也即路网的空间相关性;S4.2:通过嵌入扩散图卷积和门控递归单元GRU构建时空数据编码器,将带有空间特征的时间序列输入到门控递归单元GRU来提取交通数据之间的时间相关性,从而得到路网的时空相关性;S4.3:计算编码器内各历史时间步长的时空隐藏状态,然后将编码器的最后一个隐藏状态作为解码器的输入;S4.4:在编码器中加入注意力机制,计算编码器的上下文向量c;S4.5:在解码器中使用actor-critic算法对模型的策略参数进行优化;S5:训练模型,用平均相对误差MRE作为损失函数;并在验证集和测试集中对模型进行验证、测试。S6:在测试集中,将特征矩阵X及路网拓扑图输入到训练好的模型中来预测未来的交通状况,并评估图神经网络模型的性能。2.根据权利要求1所述的一种基于强化时空图神经网络的交通预测方法,其特征在于:所述步骤S1中预处理的过程为以5分钟为间隔通过道路周围的传感器来采集交通数据,提取交通数据样本的特征,通过滤波、归一化对原始数据进行处理,剔除无效的数据,得到时间序列数据;获得传感器的位置信息,并对所有传感器节点进行编号,通过传感器的位置信息计算相邻传感器节点之间的距离。3.根据权利要求2所述的一种基于强化时空图神经网络的交通预测方法,其特征在于:所述步骤S2中训练集中的数据占总数据的70%,验证集中的数据占总数据的10%,测试集中的数据占总数据的20%。4.根据权利要求3所述的一种基于强化时空图神经网络的交通预测方法,其特征在于:所述的步骤S2中的邻接矩阵A∈R
N
×
N
,其中A
ij
为邻接矩阵A中第i行,第j列的元素,若传感器节点i与传感器节点j相邻,则A
ij
=1,否则A
ij
=0;G中节点的特征矩阵X∈R
N
×
P
,P表示节点属性特征的数量,N表示传感器节点的个数。5.根据权利要求4所述的一种基于强化时空图神经网络的交通预测方法,其特征在于:
所述的步骤S4.1中的K阶扩散图卷积为:其中Do-1
A,D
I-1
A
T
分别表示转移矩阵及其逆矩阵,θ∈R
K
×2为滤波器的参数,x为X中的一个元素,是单个时间片对应的特征矩阵,根据扩散图卷积构建扩散卷积层来捕获空间相关性。6.根据权利要求5所述的一种基于强化时空图神经网络的交通预测方法,其特征在于:所述的步骤S4.4中在序列到序列模型中加入注意力机制,注意力机制的具体计算过程为:计算第i个输入对第j个输出的影响权重,即注意力分值:e

【专利技术属性】
技术研发人员:周毅胡姝婷周丹阳李伟张延宇杜晓玉
申请(专利权)人:河南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1