本发明专利技术公开一种基于注意力机制的城市轨道交通多步短时客流预测方法。该方法包括:获取目标区域的客流数据信息;将所述客流数据信息输入到经训练的时空综合预测模型,预测出后续多个时间步的短时客流信息,其中所述时空综合预测模型包含三个分支结构,分别为Inflow分支、OD分支和POI分支,Inflow分支基于多头注意力机制处理进站客流时间序列数据,捕捉时间维度特征;OD分支用于提取出进出站信息矩阵所携带的时间和空间相关性;POI分支用于利用感兴趣点的客流矩阵捕捉空间特征,并增强空间特征与时间特征之间的联系。本发明专利技术能够提高了短时客流预测的准确度,并扩宽预测的时间跨度。并扩宽预测的时间跨度。并扩宽预测的时间跨度。
【技术实现步骤摘要】
基于注意力机制的城市轨道交通多步短时客流预测方法
[0001]本专利技术涉及交通客流预测
,更具体地,涉及一种基于注意力机制的城市轨道交通多步短时客流预测方法。
技术介绍
[0002]城市轨道交通凭借其容量大、准点率高、速度快等特点,成为了大型城市中的重要交通工具。准确、可靠的客流预测可以为车站内行人流的控制提供支持。例如,行人流线路的引导措施能够有效地缓解站内拥堵和降低事故的发生概率,也能够为列车时刻表的制定以及优化提供有力的依据等。
[0003]传统的短期客流预测方案主要包括:基于数理统计的传统预测模型,ARIMA模型(自回归移动平均模型)、SARIMA模型(季节性时间序列模型)、卡尔曼滤波模型(Kalman Filter)、历史平均模型(HAModel)等。近年来,基于机器学习和深度学习的客流预测模型也在城市轨道交通系统中得到了广泛的应用,例如支持向量机模型(Support Vector Machine,SVM)、动态贝叶斯方法(Dynamic Bayesian)、小波分析方法(Wavelet)以及BP神经网络(Back Propagation)等。
[0004]基于深度学习的模型可以从大量数据中捕捉复杂的时间、空间相关性,显著提高了网络范围内的预测精度。然而,目前一些深度学习模型只考虑客流的时间相关性,而忽略了地铁站之间的拓扑结构。此外,大部分预测模型仅考虑单步预测,导致当时间粒度较细时预测总时间跨度较小,而当时间粒度过大时一些细节信息会丢失。
[0005]经分析,现有的短时客流预测模型主要存在以下问题:(1)传统的基于数理统计的模型对充满不确定性和复杂性的交通客流特征刻画能力较弱,存在实时性较差,预测精度较低等问题。(2)基于机器学习的模型虽然一定程度上提高了短时客流预测精度,但是在预测过程中通常无法考虑到站点之间的空间相关性,而且该类模型在处理高维问题以及复杂的时空属性数据时,能力有限。(3)基于深度学习的模型能较好的考虑网络客流的时空特征,以及网络拓扑结构,但既有的深度学习模型过于复杂,相较于一些简单模型得到的结果并没有显著性地提升;同时其所采用的单步预测得到的预测值在时间维度也存在局限性,一定程度上会导致当时间粒度较细时预测总时间跨度较小,或者当时间粒度过大时一些细节信息会丢失。
技术实现思路
[0006]本专利技术的目的是克服上述现有技术的缺陷,提供一种基于注意力机制的城市轨道交通多步短时客流预测方法。该方法包括以下步骤:
[0007]获取目标区域的客流数据信息,所述客流数据信息包括进站客流时间序列矩阵P(t),基于时间步的进出站信息矩阵OD(t),以及感兴趣点的客流矩阵POI,其中,P(t)反映各车站在设定时间间隔内的进站客流量观测值,OD(t)反映设定时间间隔内不同车站之间的进出站数量,POI反映感兴趣点的位置和类别信息;
[0008]将所述客流数据信息输入到经训练的时空综合预测模型,预测出后续k个时间步的短时客流信息,所述时空综合预测模型的输入数据与预测值之间的非线性关系表示为:
[0009][Y(t+1)
…
Y(t+k)]=f(P(t),OD(t),POI)
[0010]其中,所述时空综合预测模型包含三个分支结构,分别为Inflow分支、OD分支和POI分支,Inflow分支基于多头注意力机制处理进站客流时间序列数据,捕捉时间维度特征;OD分支用于提取出进出站信息矩阵所携带的时间和空间相关性;POI分支用于利用感兴趣点的客流矩阵捕捉空间特征,并增强空间特征与时间特征之间的联系;所述三个分支结构的输出经过特征融合层进行融合,进而经由全连接层后获得预测结果。
[0011]与现有技术相比,本专利技术的优点在于,构建一种切实有效的深度学习框架,借助于注意力机制和深度注意力模块,充分挖掘出不同数据中的时间与空间相关性并有机融合,同时利用多步预测方法来提高预测精度,并且在保证模型预测精度足够高的前提下拓宽了预测时间跨度。
[0012]通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。
附图说明
[0013]被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实施例,并且连同其说明一起用于解释本专利技术的原理。
[0014]图1是根据本专利技术一个实施例的时空综合预测模型的架构示意图;
[0015]图2是根据本专利技术一个实施例的Inflow分支中基于Transformer的LSTM网络结构图;
[0016]图3是根据本专利技术一个实施例的多头自注意力机制的架构图;
[0017]图4是根据本专利技术一个实施例的道路交通网络示意图;
[0018]图5是根据本专利技术一个实施例的城市轨道交通网络示意图
[0019]图6是根据本专利技术一个实施例的Time
‑
based OD分支中深度注意力模块结构示意图;
[0020]图7是根据本专利技术一个实施例的不同时间步数量下RMSE误差对比示意图;
[0021]图8是根据本专利技术一个实施例的地铁站A客流预测值
‑
真实值对比曲线示意图;
[0022]图9是根据本专利技术一个实施例的地铁站B客流预测值
‑
真实值对比曲线示意图;
[0023]图10是根据本专利技术一个实施例的地铁站C客流预测值
‑
真实值对比曲线示意图。
具体实施方式
[0024]现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。
[0025]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。
[0026]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0027]在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
[0028]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0029]为了能够提供准确、可靠的短时客流预测,并扩宽预测的时间跨度,本专利技术以基于Transformer机制的LSTM网络、深度注意力模块和CNN网络作为模型基础,以时间序列客流、基于时间步的OD数据以及POI数据作为数据输入,提出了城市轨道交通网络级多步短时客流预测模型(STIPM,或简称为时空综合预测模型)。
[0030]在下文中,将首先对所要解决的科学问题进行详细定义。然后,介绍所提出的深度学习框架。进而,对该框架所使用的基于注意力机制的LSTM网络和深度注意力模块进行详细说明。
[0031]一、问题定义
[0032]本专利技术的目的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于注意力机制的城市轨道交通多步短时客流预测方法,包括以下步骤:获取目标区域的客流数据信息,所述客流数据信息包括进站客流时间序列矩阵P(t),基于时间步的进出站信息矩阵OD(t),以及感兴趣点的客流矩阵POI,其中,P(t)反映各车站在设定时间间隔内的进站客流量观测值,OD(t)反映设定时间间隔内不同车站之间的进出站数量,POI反映感兴趣点的位置和类别信息;将所述客流数据信息输入到经训练的时空综合预测模型,预测出后续k个时间步的短时客流信息,所述时空综合预测模型的输入数据与预测值之间的非线性关系表示为:[Y(t+1)
…
Y(t+k)]=f(P(t),OD(t),POI)其中,所述时空综合预测模型包含三个分支结构,分别为Inflow分支、OD分支和POI分支,Inflow分支基于多头注意力机制处理进站客流时间序列数据,捕捉时间维度特征;OD分支用于提取出进出站信息矩阵所携带的时间和空间相关性;POI分支用于利用感兴趣点的客流矩阵捕捉空间特征,并增强空间特征与时间特征之间的联系;所述三个分支结构的输出经过特征融合层进行融合,进而经由全连接层后获得预测结果。2.根据权利要求1所述的方法,其特征在于,对于所述Inflow分支,进站客流时间序列矩阵P(t)通过位置编码、基于Transformer的LSTM网络层处理,并通过展平层后进入全连接层,该全连接层输出设定数量的携带有时间特征的神经元并传递到所述特征融合层。3.根据权利要求1所述的方法,其特征在于,所述基于Transformer的LSTM网络层包括位置编码层、多头注意力层、第一相加与归一化层、LSTM网络以及第二相加和归一层,其中,所述位置编码层的输出以及第一第一相加与归一化层的输出之间具有残差连接,第一相加与归一化层的输出以及第二相加与归一化层的输出之间具有残差连接。4.根据权利要求3所述的方法,其特征在于,所述多头注意力层执行以下过程:在每一注意力头中,经过位置编码后的时序向量通过三个可学习的权值矩阵W
Q
,W
K
,W
V
分别映射得到查询向量Q、键向量K以及值向量V,表示为:执行非线性仿射变换,表示为:其...
【专利技术属性】
技术研发人员:张金雷,杨立兴,陈奕洁,李小红,高自友,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。