基于多元时序数据分析的交通序列预测方法技术

技术编号:36691314 阅读:29 留言:0更新日期:2023-02-27 19:59
本发明专利技术公开了一种基于多元时序数据分析的交通序列预测方法,采用随机图扩散注意力机制提取交通序列的全局和局部空间特征,使用时间注意力提取时间特征,提升了预测精度,降低了模型的内存使用量,提升了模型在长期预测上的效果。本发明专利技术所述的基于多元时序数据分析的交通序列预测方法,使已有模型在保持长期预测的精度的前提下,解决短期预测精度不足、计算复杂度过高导致占用内存规模较大以及不够轻量化的问题。量化的问题。量化的问题。

【技术实现步骤摘要】
基于多元时序数据分析的交通序列预测方法


[0001]本专利技术涉及交通预测
,尤其是涉及一种基于多元时序数据分析的交通序列预测方法。

技术介绍

[0002]交通预测是智能交通系统(ITS)中的一项重要服务,它可以根据传感器观测到的历史交通状况(如交通流量,交通速度)预测未来的交通状况。这一功能促进了与交通管理、城市计算、公共安全等相关的广泛服务。交通预测模型通过学习过去的交通序列的特征规律,从而预测未来一段时间内的交通序列。不同于其他单变量时间序列预测问题,交通预测十分具有挑战性。作为交通领域的固有现象,当前路口的交通状况会受到附近和远处路口的交通状况的影响,这意味着它们之间存在一定的空间依赖性。同时,交通序列的走势会受到历史走势的影响,充分考虑交通序列的时间依赖性也是重中之重。交通路网的复杂的时空相关性严重限制了交通流预测的有效性。
[0003]近年来,越来越多的新方法被提出,它们通过对时空特征进行建模,很好的提升了短期交通预测的精度,在一定程度上也提升了长期交通预测的精度。虽然随着时间的流逝,众多方法在短期交通预测上展现出了优异的效果,但它们并没有很好的提升长期交通预测的效果。现有方法通常采用图卷积神经网络对局部空间信息进行建模,使用卷积神经网络(CNN)或者循环神经网络(RNN)对时间信息进行建模,这些方法都着重于对局部信息的提取而缺乏全局信息的利用。直到注意力机制(Attention,AT)被提出,深度学习上有了一个通用的可以捕获全局特征的方法。在最新的模型中,GMAN使用注意力机制构建模型,在长期交通预测中取得了最好的效果。
[0004]GMAN采用Encoder

Decoder架构,使用注意力机制分别对空间和时间两个维度提取特征,并使用转换注意力机制来缓解历史交通序列月预测交通序列之间的误差。GMAN有效提高了交通预测中长期预测的精度,但它存在一些问题:
[0005]1、空间注意力具有的高计算复杂度导致内存使用量大;
[0006]2、不具备对空间维度局部特征捕获的能力,导致短期预测的精度降低;
[0007]3、预测时间开销大,不够轻量化。

技术实现思路

[0008]本专利技术的目的是提供一种基于多元时序数据分析的交通序列预测方法,使已有模型在保持长期预测的精度的前提下,解决短期预测精度不足、计算复杂度过高导致占用内存规模较大以及不够轻量化的问题。
[0009]为实现上述目的,本专利技术提供了一种基于多元时序数据分析的交通序列预测方法,包括如下步骤:
[0010]步骤1:先对公共交通序列数据集进行数据预处理,获得训练数据集和验证数据集;
[0011]步骤2:借助于步骤1得到的训练数据集,每次随机选取16组训练数据,输入到随机图扩散注意力模型中,每组数据中的历史时间时间信息和未来时间时间信息和预定义图结构信息输入到图扩散注意力模型中的时空embedding生成器中生成历史时空embedding和未来时空embedding;
[0012]步骤3:将历史交通数据和历史时空embedding送入编码器,分别使用图扩散注意力模块和时间注意力模块提取空间特征和时间特征,并使用gate fusion模块融合两种特征生成历史时空特征;
[0013]步骤4:将历史时空特征、历史时空embedding和未来时空embedding送入转化注意力模块,生成未来时空特征;
[0014]步骤5:将历史交通数据和未来时空embedding送入编码器,分别使用图扩散注意力模块和时间注意力模块提取空间特征和时间特征,并使用gate fusion模块融合两种特征生成未来时空特征,最后使用未来时空特征生成最终的预测序列;
[0015]步骤6:计算步骤5得到最终的生成预测序列与预测序列之间的平均绝对误差、均方根误差和平均绝对百分误差,然后通过Adam优化器进行反向传播,更新网络参数,最终得到训练好的随机图扩散注意力模型;
[0016]步骤7:借助于步骤6更新网络参数后的模型与步骤1得到的测试数据集,选取16组测试数据作为输入,执行步骤2至步骤6,其中将步骤2中的训练数据替换成选取的16组测试数据,最终得到基于测试数据生成的预测序列;
[0017]步骤8:借助于步骤7得到的基于测试数据生成的预测序列,计算该预测序列与真实序列之间的平均绝对误差,求得所有组数据的平均绝对误差后求均值,得到最终代表模型表现的平均绝对误差;
[0018]步骤9:重复步骤2至步骤8,直至步骤8得到的平均绝对误差不再减小,说明模型表现达到最优,则网络参数更新完毕,模型结束训练。
[0019]优选的,步骤1的具体方法为:选取合适的公共交通序列数据集,根据要求设定历史序列长度、预测序列长度,将输入的数据进行分割,每组数据各包含一个历史序列、预测序列和两个序列对应的时间信息;将所有的历史序列、预测序列和时间信息,按组分为训练数据集和测试数据集,完成数据预处理;在完成数据分组之后,截取70%组数据作为训练数据集,30%组数据作为验证数据集。
[0020]优选的,步骤2中的图扩散注意力模型包括时空embedding生成器、需要输入每组数据中的历史数据和历史时空embedding来进行编码的编码器、、使用历史时空embedding和未来时空embedding对输入数据进行转化的转化注意力模块、需要未来时空embedding和转化注意力模块的输出进行解码输出预测序列的解码器。
[0021]优选的,时空embedding生成器包括用来接收时间信息的时间embedding生成器和用来接收图结构信息的空间embedding生成器,时空embedding生成器的总体公式如下所示:
[0022]e
T
=MLP(e
d
||e
w
)
[0023]e
S
=Node2vec(A)
[0024]E=e
T
+e
S
[0025]其中e
T
为时间embedding,e
d
,e
w
分别表示时间信息中的日内的时刻信息和周内的
日期信息;e
S
为空间embedding,A为预定义的路网的邻接矩阵,Node2vec()为用于对路网信息进行编码的node2vec算法;E为时空embedding,时空embedding分为历史时间时空embeddingE
H
和历史embeddingE
F

[0026]优选的,编码器和编码器的核心模块是图扩散注意力模块和时间注意力模块的和,时间注意力模块的公式如下所示:
[0027]B
l
=Concatenate(H
l
‑1,E
H
)
[0028][0029][0030]H
l
‑1为第l层编码器的输入序列,B表示输入本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多元时序数据分析的交通序列预测方法,其特征在于,包括如下步骤:步骤1:先对公共交通序列数据集进行数据预处理,获得训练数据集和验证数据集;步骤2:借助于步骤1得到的训练数据集,每次随机选取16组训练数据,输入到随机图扩散注意力模型中,每组数据中的历史时间时间信息和未来时间时间信息和预定义图结构信息输入到图扩散注意力模型中的时空embedding生成器中生成历史时空embedding和未来时空embedding;步骤3:将历史交通数据和历史时空embedding送入编码器,分别使用图扩散注意力模块和时间注意力模块提取空间特征和时间特征,并使用gate fusion模块融合两种特征生成历史时空特征;步骤4:将历史时空特征、历史时空embedding和未来时空embedding送入转化注意力模块,生成未来时空特征;步骤5:将历史交通数据和未来时空embedding送入编码器,分别使用图扩散注意力模块和时间注意力模块提取空间特征和时间特征,并使用gate fusion模块融合两种特征生成未来时空特征,最后使用未来时空特征生成最终的预测序列;步骤6:计算步骤5得到最终的生成预测序列与预测序列之间的平均绝对误差、均方根误差和平均绝对百分误差,然后通过Adam优化器进行反向传播,更新网络参数,最终得到训练好的随机图扩散注意力模型;步骤7:借助于步骤6更新网络参数后的模型与步骤1得到的测试数据集,选取16组测试数据作为输入,执行步骤2至步骤6,其中将步骤2中的训练数据替换成选取的16组测试数据,最终得到基于测试数据生成的预测序列;步骤8:借助于步骤7得到的基于测试数据生成的预测序列,计算该预测序列与真实序列之间的平均绝对误差,求得所有组数据的平均绝对误差后求均值,得到最终代表模型表现的平均绝对误差;步骤9:重复步骤2至步骤8,直至步骤8得到的平均绝对误差不再减小,说明模型表现达到最优,则网络参数更新完毕,模型结束训练。2.根据权利要求1所述的基于多元时序数据分析的交通序列预测方法,其特征在于,步骤1的具体方法为:选取合适的公共交通序列数据集,根据要求设定历史序列长度、预测序列长度,将输入的数据进行分割,每组数据各包含一个历史序列、预测序列和两个序列对应的时间信息;将所有的历史序列、预测序列和时间信息,按组分为训练数据集和测试数据集,完成数据预处理;在完成数据分组之后,截取70%组数据作为训练数据集,30%组数据作为验证数据集。3.根据权利要求1所述的基于多元时序数据分析的交通序列预测方法,其特征在于,步骤2中的图扩散注意力模型包括时空embedding生成器、需要输入每组数据中的历史数据和历史时空embedding来进行编码的编码器、、使用历史时空embedding和未来时空embedding对输入数据进行转化的转化注意力模块、需要未来时空embedding和转化注意力模块的输出进行解码输出预测序列的解码器。4.根据权利要求3所述的基于多元时序数据分析的交通序列预测方法,其特征在于,时空embedding生成器包括用来接收时间信息的时间embedding生成器和用来接收图结构信息的空间embedding生成器,时空embedding生成器的总体公式如下所示:
e
T
=MLP(e
d

【专利技术属性】
技术研发人员:翁文超樊谨田浩
申请(专利权)人:浙江省交通运输科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1