融合注意力机制和图神经网络的轨道交通客流预测方法技术

技术编号:35012678 阅读:16 留言:0更新日期:2022-09-21 15:08
本发明专利技术涉及城市轨道交通客流数据分析技术领域,提出一种融合注意力机制和图神经网络的轨道交通客流预测方法,包括:采用基于注意力机制的时空图卷积模型,利用训练集对时空图卷积模型进行训练,获得第一预测客流量数据;计算第一预测客流量数据的损失,优化时空图卷积模型;将测试集输入优化后的时空图卷积模型,输出第二预测客流量数据;计算第二预测客流量数据的损失,将两损失进行对比,判断优化后的时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整模型中的超参数设置;若否,则将第二预测客流量数据认定为最终客流量数据。如此方案解决现有技术中相关预测方法不足和预测结果误差大等问题,实现预测结果精准无误。无误。无误。

【技术实现步骤摘要】
融合注意力机制和图神经网络的轨道交通客流预测方法


[0001]本专利技术涉及城市轨道交通客流数据分析
,尤其涉及一种融合注意力机制和图神经网络的轨道交通客流预测方法、系统、电子设备以及计算机可读存储介质。

技术介绍

[0002]近年来,我国城市轨道交通由大规模建设转为大规模安全服役阶段,轨道交通网络规模不断扩大,客流运营与管理压力日益提升,轨道交通网络供给与客流需求运力匹配的协调至关重要。在当前新技术、新算法和新理念的综合加持下,轨道交通系统迎来了一大波创新性的研究成果,轨道交通客流预测方法的研究也受到广泛的关注。准确的客流预测在轨道交通列车调控、轨道交通警报发布、服务效率提升的工作中起到至关重要的作用。然而,在城市轨道交通客流规模扩张和城市用地布局多变的复杂环境下,轨道交通“网

线

站”多粒度动态客流预测非常困难,同时在外部因素的干扰下,例如环境因素、节假日、大型活动等,高度的非线性和不确定性给客流预测带来了严峻的挑战。因此,构建融合巨量异构客流和复杂外在因素的轨道交通高精度预测模型是极为迫切。
[0003]目前,国内外在轨道交通乘客出行特征的研究中完成了丰富的工作,但是将乘客区域出行特征融合客流预测工作的较少。在轨道交通客流预测中,网络中站点的随地理位置的不同,具有的客流分布特征不同,且受周围例如重大活动、极端天气等影响时客流产生突变,整体客流是非线性的,基于数理统计分析的预测模型在面对较大变动的客流时往往不能实现良好的预测效果。在基于数理统计分析和浅层机器学习的模型中,通常需要通过组合模型进行交通预测工作以达到高精度的预测效果,且面对的预测对象为单条道路或者单个站点,在整个轨道线网中通常不能进行高精度的预测。而在基于深度学习的模型中,深度模型单体总体显示了高于数理统计分析和浅层机器学习模型的预测性能,且在融合CNN模块后可以进行区域性的预测工作,但是CNN的局限性在于其结构只能针对规则的网格结构进行空间特征的提取,这也就是学者们在基于CNN模型的研究中大多预测对象对可以将道路划分为网格结构的交通流数据,在轨道交通网络中各个站点之间呈现明显的非欧结构,无法使用CNN模型作为其预测框架。GCN图神经网络模型可以根据轨道交通网络拓扑结构进行站点间空间关系的学习,将基于区域预测的深度学习模型应用于轨道交通客流预测领域。在针对图神经网络的研究中,虽然学者可以将深度学习模型应用于轨道交通线网的预测中,但目前考虑到对站点客流属性加强的研究较少。

技术实现思路

[0004]本专利技术的目的在于解决
技术介绍
中的至少一个技术问题,提供一种融合注意力机制和图神经网络的轨道交通客流预测方法、系统、电子设备和计算机可读存储介质。
[0005]为实现上述专利技术目的,本专利技术提供一种融合注意力机制和图神经网络的轨道交通客流预测方法,包括:获取历史轨道交通客流量数据,将所述历史轨道交通客流量数据分为训练集和测
试集;采用基于注意力机制的图时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;将所述测试集输入优化后的所述时空图卷积模型,输出第二预测客流量数据;计算所述第二预测客流量数据与真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比,判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整优化后的所述时空图卷积模型中的超参数设置,调整后再对所述测试集进行测试,输出最终预测客流量数据;若否,则将所述第二预测客流量数据认定为最终客流量数据。
[0006]根据本专利技术的一个方面,所述时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层。
[0007]根据本专利技术的一个方面,所述图卷积网络GCN层将轨道交通线网所有站点的客流量提取出空间维度的特征,计算公式为:选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,其中,D表示度矩阵,对角线上的元素为图中各个顶点的度,表示每个顶点的度;A表示以轨道交通线网为基础建立的邻接矩阵;表示邻接矩阵A上i行j列的值;i表示矩阵的第i行;j表示矩阵的第j列;为优化后的邻接矩阵;为优化后的度矩阵;为单位矩阵;L表示拉普拉斯矩阵;U表示是拉普拉斯矩阵经过特征值分解得到的正交矩阵;是矩阵U的转置,T为转置符号;为n个特征值构成的对角阵;为特征值;表示第l层的特征矩阵;表示在特定层L层中的可训练权重矩阵;为线网进站客流量特征矩阵;表示激活函数。
[0008]根据本专利技术的一个方面,所述双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的客流量提取出时间维度的特征,其中单向的LSTM模型计算公式为:
其中,表示遗忘层输出的遗忘权重结果;为遗忘门中和的权重矩阵;表示t时刻2层图神经网络输出的隐藏层的隐藏状态;为当前时刻输入的外部特征序列;为遗忘门中的偏置参数;表示记忆层输出的记忆权重结果;为记忆门中和的权重矩阵;为记忆门中的偏置参数;表示描述当前细胞记忆状态的参数;sigmiod、tanh为激活函数;表示记忆细胞状态储存单元中和的权重矩阵;表示记忆细胞状态储存单元中的偏置参数;表示t

1时刻的记忆状态;表示当前时刻的记忆状态;表示输出层输出的遗忘权重结果;为输出门中和的权重矩阵;为输出门中的偏置参数;表示模型t时刻的输出;将正反两个方向的LSTM模型输出和结合得到BiLSTM输出;;其中,表示BiLSTM模型t时刻的输出。
[0009]根据本专利技术的一个方面,所述激活层为全连接层,全连接层将BiLSTM输出的多维向量进行维度转变,最终得到所需维度进行输出,计算过程如以下公式:其中,y表示记时刻输出的进站客流预测值;Q为总时间步长。
[0010]根据本专利技术的一个方面,所述损失函数计算层采用损失函数loss计算预测客流量数据与真实客流量数据之间的损失,计算公式为:其中,y
t
为预测客流量数据,y
yt
为真实客流量数据,为正则化系数,为L2正则化项。
[0011]根据本专利技术的一个方面,所述注意力机制的计算公式包括:根据本专利技术的一个方面,所述注意力机制的计算公式包括:
其中,F
t
为预测客流量数据y
t
对应的特征向量;表示训练时的赋予包含了输入序列中之前时刻的进站客流信息向量h
t
的权重,由第个时刻输出的隐藏状态,以及h
t
决定的;表示j时刻注意力权重打分情况;表示k时刻注意力权重打分情况;h
j
表示j时刻的隐藏层状态;k和j表示相应时刻;在所述注意力机制的解码器中,由F
...

【技术保护点】

【技术特征摘要】
1.融合注意力机制和图神经网络的轨道交通客流预测方法,其特征在于,包括:获取历史轨道交通客流量数据,将所述历史轨道交通客流量数据分为训练集和测试集;采用基于注意力机制的图时空图卷积模型,利用所述训练集对所述时空图卷积模型进行训练,获得第一预测客流量数据;计算所述第一预测客流量数据与真实客流量数据之间的损失,优化所述时空图卷积模型;将所述测试集输入优化后的所述时空图卷积模型,输出第二预测客流量数据;计算所述第二预测客流量数据与真实客流量数据之间的损失,将该损失与所述第一预测客流量数据与真实客流量数据之间的损失进行对比,判断优化后的所述时空图卷积模型是否出现欠拟合或者过拟合现象,若是,则调整优化后的所述时空图卷积模型中的超参数设置,调整后再对所述测试集进行测试,输出最终预测客流量数据;若否,则将所述第二预测客流量数据认定为最终客流量数据。2.根据权利要求1所述的融合注意力机制和图神经网络的轨道交通客流预测方法,其特征在于,所述时空图卷积模型包括图卷积网络GCN层、双向长短时记忆神经网络BiLSTM层、激活层和损失函数计算层。3.根据权利要求2所述的融合注意力机制和图神经网络的轨道交通客流预测方法,其特征在于,所述图卷积网络GCN层将轨道交通线网所有站点的客流量提取出空间维度的特征,计算公式为:选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,选择2层图卷积作为图卷积网络GCN层属性,其中,D表示度矩阵,对角线上的元素为图中各个顶点的度,表示每个顶点的度;A表示以轨道交通线网为基础建立的邻接矩阵;表示邻接矩阵A上i行j列的值;i表示矩阵的第i行;j表示矩阵的第j列;为优化后的邻接矩阵;为优化后的度矩阵;为单位矩阵;L表示拉普拉斯矩阵;U表示是拉普拉斯矩阵经过特征值分解得到的正交矩阵;是矩阵U的转置,T为转置符号;为n个特征值构成的对角阵;为特征值;表示第l层的特征矩阵;表示在特定层L层中的可训练权重矩阵;为线网进站客流量特征矩阵;表
示激活函数。4.根据权利要求3所述的融合注意力机制和图神经网络的轨道交通客流预测方法,其特征在于,所述双向长短时记忆神经网络BiLSTM层对融合了所述空间维度的特征的客流量提取出时间维度的特征,其中单向的LSTM模型计算公式为:提取出时间维度的特征,其中单向的LSTM模型计算公式为:提取出时间维度的特征,其中单向的LSTM模型计算公式为:提取出时间维度的特征,其中单向的LSTM模型计算公式为:提取出时间维度的特征,其中单向的LSTM模型计算公式为:提取出时间维度的特征,其中单向的LSTM模型计算公式为:其中,表示遗忘层输出的遗忘权重结果;为遗忘门中和的权重矩阵;表示t时刻2层图神经网络输出的隐藏层的隐藏状态;为当前时刻输入的外部特征序列;为遗忘门中的偏置参数;表示记忆层输出的记忆权重结果;为记忆门中和的权重矩阵;为记忆门中的偏置参数;表示描述当前细胞记忆状态的参数;sigmiod、tanh为激活函数;表示记忆细胞状态储存单元中和的权重矩阵;表示记忆细胞状态储存单元中的偏置参数;表示t

1时刻的记忆状态;表示当前时刻的记忆状态;表示输出层输出的遗忘权重结果;为输出门中和的权重矩阵;为输出门中的偏置参数;表示模型t时刻的输出;将正反两个方...

【专利技术属性】
技术研发人员:李之红张晶王子男王晓雨许晗
申请(专利权)人:北京建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1