一种基于注意力机制的BiLSTM和LightGBM模型的交通预测方法技术

技术编号:35264269 阅读:49 留言:0更新日期:2022-10-19 10:25
本发明专利技术公开了一种基于注意力机制的BiLSTM网络和LightGBM模型的交通预测方法,采用增加了注意力机制的BiLSTM网络和LightGBM模型,通过同时捕获交通路网的时间依赖性即交通流的局部时间变化趋势和空间依赖性即拓扑空间结构,通过历史时间步的交通流量预测未来时间步的各个路段的交通流量,由此准确预测道路网络的交通流。本发明专利技术方法能够有效预测交通流的时空变化特征和规律,预测精度高,提升了交通流预测效果。交通流预测效果。交通流预测效果。

【技术实现步骤摘要】
一种基于注意力机制的BiLSTM和LightGBM模型的交通预测方法


[0001]本专利技术涉及智能交通
,具体涉及一种基于注意力机制的BiLSTM网络和LightGBM模型的交通预测方法。

技术介绍

[0002]交通流预测被认为是发展智能交通网络的最关键和高需求的措施。它的可靠性不仅是目前为止最好的预警技术,而且有助于缓解拥堵、提供备用路线引导、有效的交通管理以及采取先进的安全措施。它也有助于建立一个基础设施网络,既能满足当前需求,又能满足未来需求,以避免交通混乱、人力不足和系统开发成本上升。可以使用网络中过去的流量行为历史来估计流量。例如,它取决于模式,包括工作日、周末、高峰时间和深夜,以及特定日期重大事件和天气条件的交通情况。为了研究、分析和预测这种模式,交通流由每小时车辆数、车道密度和车速组成。城市交通行为的不确定性导致了对精确预测方法的需求。
[0003]目前已有很多交通预测模型,以往的短期交通流预测方法大致可分为三类:参数方法、非参数方法和混合方法。参数方法包括时间序列方法和卡尔曼滤波。基于时间序列方法的广泛使用的模型是自回归综合移动平均(ARIMA)模型及其许多变体,如(KARIMA)、子集ARIMA、季节ARIMA(SARIMA)。然而,由于交通流的随机性和非线性性,这些技术只考虑交通流的时间变化,从而提供不令人满意的预测性能。非参数方法包括k

最近邻(k

NN)方法、支持向量回归(SVR)和人工神经网络(ANN)。然而,已有研究表明,用于交通流预测的k

NN方法并不优于时间序列方法。此外,传统的基于机器学习的方法利用人工构建的特征来捕捉交通流的特征,这不足以获得准确的预测性能。此外,早期基于工作的神经网络通常使用浅层网络或只有一个隐藏层的网络,这也无法捕捉交通流的不确定性和复杂非线性。

技术实现思路

[0004]1.所要解决的技术问题:
[0005]针对上述技术问题,本专利技术提供一种基于注意力机制的BiLSTM网络和LightGBM模型的交通预测方法,通过改变决策树算法的决策规则,LightGBM在不进行转换的情况下为分类特征提供直接的本地支持,准确预测城市道路网络的交通流;能够实现同时捕获城市交通路网的时间依赖性和空间依赖性从而提高交通预测精度。
[0006]2.技术方案:
[0007]一种基于注意力机制的BiLSTM网络和LightGBM模型的交通预测方法,其特征在于:包括以下步骤:
[0008]步骤一:对采集到的原始交通数据进行预处理,根据预处理后的交通流数据生成城市交通网络中节点的交通流属性特征矩阵;所述原始交通数据包括位于高速公路和市区的传感器收集的各个路段的交通流特征;所述交通流特征包括各个路段的日期及时间、车道内车辆的平均速度、每小时通过的车辆数、车道内车辆的密度;所述节点的属性特征矩阵
为以路段作为节点,用特征矩阵的方式记录节点的交通流特征;
[0009]步骤二:构建城市交通网络拓扑结构图;结合节点的属性特征矩阵,根据城市交通网络的连接属性从而构建城市交通网络拓扑结构图;
[0010]步骤三:对表示路段之间的连接情况的邻接矩阵A进行标准化处理;
[0011]步骤四:通过添加了注意力机制的BiLSTM网络获取交通网中各交通节点处的交通流特征及每个时间步对该点的贡献进行分配每个时间步的相应权重,并输出该交通节点处的交通流特征的加权和;
[0012]步骤五:对步骤四中输出的每个时间步的隐藏状态及其对应的加权和作为数据集,然后将每个数据集输入到相应的LightGBM个体中进行预测其下一时间步数据集;根据其预测的结果与历史上对应的时间步的结果进行比对从而实现训练LightGBM模型;,在训练过程中采用激活TPE对训练进行优化,并且通过KCV验证预测的结果的准确性,最终得到基于注意力机制的BiLSTM网络和LightGBM模型;
[0013]步骤六:将待预测的交通流的路段信息,输入步骤五生成的模型中,获得最终的预测。
[0014]进一步地,步骤二具体包括:将交通网络拓扑结构图表示为G,G=(V,E,A);将每条路段看作图中的一个节点;V表示路段节点的集合,集合中的每个节点均为其对应的属性特征矩阵;E表示路段的边的集合;路段之间的连通情况由邻接矩阵A∈R
n*n
表示,所述邻接矩阵A由0和1组成,0表示两条路段之间不相连,1表示两条路段之间相连,A
ij
=1表示路段v
i
和v
j
是相连的,A
ij
=0,则表示路段v
i
和v
j
不相连;
[0015]则城市交通网络拓扑结构图具体表示为如下式(1):
[0016][0017]进一步地,步骤三中对邻接矩阵A进行标准化处理为:
[0018][0019](2)式中,I为单位对角度矩阵,其除对角线上的元素外,其他元素均为0;A

为标准化后的邻接矩阵;D

表示对邻接矩阵A进行构造对角度矩阵的。
[0020]进一步地,步骤四具体包括以下步骤:
[0021]S41:构建基于BiLSTN网络的城市交通网络模块;
[0022]所述基于双向LSTM网络的城市交通网络模块包括多个双向LSTM的结构;每个双向LSTM的结构包含两个上下堆叠的单向LSTM,其中的前向通道为单向LSTM用于将数据向前传递,后向通道为单向LSTM用于将数据向后传递;将历史上的周期性交通流特征分别输入双向LSTM的结构,且通过前向通道与后向通道分别输出该通道的隐藏状态H并将输出的两个通道的隐藏状态结合起来作为双向LSTM的结构的输出;
[0023]其中,表示具有日周期性的交通流历史特征序列;表示具有周周期性的交通流历史特征序列,如下式表示:
[0024][0025][0026]公式(3)和(4)中,t
d
表示日周期中最后一天中与时间t相同的时刻,t
ω
表示周周期数据中上周期时间t的同一时刻;t
d

n表示日周期中第d天t

n时刻;表示日周期中的第d天t

n时刻的交通流特征;t
w

n表示周周期中第w周t

n时刻;表示周周期数据中的第w周t

n时刻的交通流特征;
[0027]S42:构建增加注意力机制的BiLSTN网络模型;将BiLSTM网络输出带有时序信息的隐形状态输入至注意力层,注意力层根据每一时间步对预测时间点的贡献程度不同为其训练出对应的一组权重向量集,并对该权重向量集与其对应的输入进行加权求和作为注意力层的输出;所述一组权重向量集中的每各权重向量分别对应其每个时间步中的每个交通流特征的权重;具体包括步骤S421至S423:
[0028]S421:预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的BiLSTM网络和LightGBM模型的交通预测方法,其特征在于:包括以下步骤:步骤一:对采集到的原始交通数据进行预处理,根据预处理后的交通流数据生成城市交通网络中节点的交通流属性特征矩阵;所述原始交通数据包括位于高速公路和市区的传感器收集的各个路段的交通流特征;所述交通流特征包括各个路段的日期及时间、车道内车辆的平均速度、每小时通过的车辆数、车道内车辆的密度;所述节点的属性特征矩阵为以路段作为节点,用特征矩阵的方式记录节点的交通流特征;步骤二:构建城市交通网络拓扑结构图;结合节点的属性特征矩阵,根据城市交通网络的连接属性从而构建城市交通网络拓扑结构图;步骤三:对表示路段之间的连接情况的邻接矩阵A进行标准化处理;步骤四:通过添加了注意力机制的BiLSTM网络获取交通网中各交通节点处的交通流特征及每个时间步对该点的贡献进行分配每个时间步的相应权重,并输出该交通节点处的交通流特征的加权和;步骤五:对步骤四中输出的每个时间步的隐藏状态及其对应的加权和作为数据集,然后将每个数据集输入到相应的LightGBM个体中进行预测其下一时间步数据集;根据其预测的结果与历史上对应的时间步的结果进行比对从而实现训练LightGBM模型;,在训练过程中采用激活TPE对训练进行优化,并且通过KCV验证预测的结果的准确性,最终得到基于注意力机制的BiLSTM网络和LightGBM模型;步骤六:将待预测的交通流的路段信息,输入步骤五生成的模型中,获得最终的预测。2.如权利要求1所述的一种基于注意力机制的BiLSTM网络和LightGBM模型的交通预测方法,其特征在于:步骤二具体包括:将交通网络拓扑结构图表示为G,G=(V,E,A);将每条路段看作图中的一个节点;V表示路段节点的集合,集合中的每个节点均为其对应的属性特征矩阵;E表示路段的边的集合;路段之间的连通情况由邻接矩阵A∈R
n*n
表示,所述邻接矩阵A由0和1组成,0表示两条路段之间不相连,1表示两条路段之间相连,A
ij
=1表示路段v
i
和v
j
是相连的,A
ij
=0,则表示路段v
i
和v
j
不相连;则城市交通网络拓扑结构图具体表示为如下式(1):3.如权利要求2所述的一种基于注意力机制的BiLSTM网络和LightGBM模型的交通预测方法,其特征在于:步骤三中对邻接矩阵A进行标准化处理为:(2)式中,I为单位对角度矩阵,其除对角线上的元素外,其他元素均为0;A

为标准化后的邻接矩阵;D

表示对邻接矩阵A进行构造对角度矩阵的。
4.如权利要求3所述的一种基于注意力机制的BiLSTM网络和LightGBM模型的交通预测方法,其特征在于:步骤四具体包括以下步骤:S41:构建基于BiLSTN网络的城市交通网络模块;所述基于双向LSTM网络的城市交通网络模块包括多个双向LSTM的结构;每个双向LSTM的结构包含两个上下堆叠的单向LSTM,其中的前向通道为单向LSTM用于将数据向前传递,后向通道为单向LSTM用于将数据向后传递;将历史上的周期性交通流特征分别输入双向LSTM的结构,且通过前向通道...

【专利技术属性】
技术研发人员:许坤波石运郝苏申李猛王云霞
申请(专利权)人:南京工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1