一种基于多尺度空间特征挖掘的交通流量预测方法技术

技术编号:37479426 阅读:11 留言:0更新日期:2023-05-07 09:20
本发明专利技术提出了一种基于多尺度空间特征挖掘的交通流量预测方法。该方法引入多尺度空间关系捕捉和依赖于注意力机制的空间关联权重模型来抓取交通流中全方位的空间依赖关系。该方法通过时间卷积网络和图卷积门控机制来逐级扩充模型的时空特征提取能力,充分提取历史交通时空流中的关联特征关系。在预测问题的求解过程中,通过层级间的图卷积网络操作提取空间特征,采用不同层级的图卷积网络构建多尺度的空间关系,建模随时间变化的空间关系。最后,通过注意力机制将逐层隐藏特征进行聚合,从全局特征的角度建模历史时空特征,从而更加精准地预测未来的交通状况。地预测未来的交通状况。地预测未来的交通状况。

【技术实现步骤摘要】
一种基于多尺度空间特征挖掘的交通流量预测方法


[0001]本专利技术涉及一种基于多尺度空间特征挖掘的交通流量预测方法
技术背景
[0002]智慧交通是城市智能化发展建设过程中的重要组成部分,交通流量预测(traffic flow predication)作为智慧交通系统的底层构件,近年来成为研究的热点方向。借助于深度学习技术发展所带来的时空特征分析工具,交通预测的准确性在近年来有了跨越式的提升。此类方法不仅可以通过构建模型在高维特征空间中抓取交通流的时间和空间特征,而且可以进一步通过多组件协同来对时空关联同时抓取,从而进一步提高历史数据之间隐含关联的挖掘能力,更加精准的做出对未来时段的交通状况的预测。
[0003]交通预测问题具体的可做出如下定义:
[0004]其中表示历史交通数据,其中T
his
表示选取的历史侦测时间序列的时间片数量,N表示侦测的交通节点数,F表示历史数据的特征维度。Φ表示在交通预测过程中所使用的额外附加信息,如某一时刻的天气状况,侦测节点的道路车道数等。f(*)表示预测模型,其根据历史交通数据和额外的附加信息来生成未来时段的预测交通状况T
pre
表示预测的时间长度,F

表示预测的特征维度。
[0005]交通流量的预测不但需要考虑单一节点上交通流随时间的变化趋势,也要对节点之间的相互影响进行建模,因此是一类典型的多元时间序列预测问题。同时,序列的预测问题是一类典型的回归问题,即通过分析历史数据的时空特征来拟合预测时间多节点交通变化曲线。因此为尽可能优化模型性能,模型的训练过程即为寻找能够是预测结果和真实未来时段交通状况相匹配的模型参数,使预测和真实未来交通状况之间的误差尽可能小,因此预测问题转化为了对损失函数(Loss Function)的优化问题,等价于如下公式:
[0006]其中Opimizer(
·
)表示优化过程,Loss(
·
)表示损失函数。深度学习的训练过程主要分为前向传播和反向传播两者过程,前向传播过程即根据模型的架构和参数和输入的历史数据生成预测结果,在传播过程中模型会记录每个参数执行的运算步骤从而在损失函数计算出误差后来计算梯度从而执行反向传播过程使模型朝着最小化误差的方向收敛到全局最优解。目前常用的反向传播算法主要包括随机梯度下降(Stochastic Gradient Descent,SGD),冲量法(momentum method),Adam以及AdamW等。
[0007]本专利技术实施例是提供一种多尺度空间特征挖掘的交通流量预测方法,根据交通流随时间变化的特征来建模节点间的多尺度空间关系,进而提高模型预测的精确性,为智慧交通系统的构建提供坚实底层模块。

技术实现思路

[0008]本专利技术解决上述问题的方案如下:一种基于多尺度空间特征挖掘的交通流量预测方法,其特征在于:在交通流量预测中引入多尺度空间特征提取模块,利用基于时间卷积网络(Temporal Convolution Network,TCN)的基础上,逐层且依照交通时空特征沿时间轴顺序增添不同适度的图卷积网络(Graph Convolution Network,GCN)来提取交通流中隐含时空特征,同时为增引入自注意力机制(Self

attention mechanism)和残差网络来提升模型对全局时空特征的感知能力。
[0009]模型架构以时间卷积网络作为主体,每层时间卷积层的操作可抽象为如下操作:
[0010]其中为时间卷积第l层的特征序列,Conv(*)
k
表示卷积核大小为k的1维时间卷积,LayerNormal为层归一化操作,LeakyReLU为激活函数。T表示第l层特征序列的长度,c表示时空特征的特征通道数。第一层输入为X
h
,即原始交通时空序列。
[0011]为在特征提取的过程中能够提取到交通侦测节点之间的相互作用关系即节点间的空间关联,模型在时间卷积层之上设计了多尺度空间特征提取模块用来抓取节点间的空间关系。首先,模型多尺度空间特征提取模块采用多组不同层数GCN构建块组成,每个GCN构建块包含两层GCN和一个GLU操作具体如下:
[0012]其中为模型第l层的第i个时间片上的GCN构建块的输出。tanh为双曲正切函数,LeakyReLU操作中α为调整操作数x在小于等于0时的斜率调整系数。是第l层的第i个时间片上的交通特征,通过在时间轴上根据顺序来堆叠不同数量的GCN构建块,解除了单层GCN仅能够捕获邻接节点之间空间关联的限制。同时,本方法根据历史数据所处的时间位置来确定图卷积的层数,为规避多层图卷积所带来的过度平滑问题在每个构建块中使用了残差连接。通过将多尺度空间特征提取模块的输出沿时间方向进行拼接得到:
[0013]即模型第l层多尺度空间特征提取模块的输出。
[0014]上述过程的GCN操作使用图傅里叶变换将原始的图节点信息从空间域转换到谱域来进行卷积运算从而聚合节点之间的空间信息:
[0015]其中为可学习的参数,X为图结构数据。为傅里叶偏置,是归一化图拉普拉斯算子的特征向量矩阵。是单位矩阵,是对角度矩阵,其中D
ii
=∑
j
A
ij
。A是表示图节点间关系的邻接矩阵。是
L的特征值对角矩阵。由于上述计算过程中需要计算出图拉普拉斯矩阵的特征值,这一过程的计算时间复杂度为O(n2),因此引入切比雪夫多项式来降低式(4)的复杂度:
[0016]其中λ
max
为拉普拉斯矩阵L的最大特征值,表示缩放拉普拉斯矩阵。
[0017]模型通过节点嵌入来从时空数据中自适应学习节点的向量表征形式从而生成邻接矩阵用以执行图卷积操作。具体如下:
[0018]其中表示节点嵌入矩阵,e为节点嵌入的维数,一般根据式(7)的方式进行选取。为根据节点嵌入生成的节点邻接矩阵。e=min{e|2
e
≥N}
ꢀꢀ
(9)
[0019]更进一步,对于多尺度空间特征提取得到的时空特征矩阵,一方面直接将其直接进行LayerNormal和激活函数操作,同时引入自注意力机制来提取全局时空特征作为残差连接,具体操作如下:连接,具体操作如下:连接,具体操作如下:连接,具体操作如下:
[0020]其中X
Q
,X
K
以及X
V
是模型中每一层中图卷积结果序列X
st
经过线性变换之后得到的结果,对应自注意力机制中的Query,Key以及Value向量。W

Ql
,W

Kl
以及W

Vl
是对应的显性变换矩阵。之后将X
Q
和X
K
执行缩放点积后执行Softmax(*)操作得到注意力分,然后将该注意力分和X
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度空间特征挖掘的交通流量预测方法,其特征在于:在交通流量预测中引入多尺度空间特征提取模块,利用基于时间卷积网络的基础上,逐层且依照交通时空特征沿时间轴顺序增添不同适度的图卷积网络来提取交通流中隐含时空特征,同时为增引入自注意力机制和残差网络来提升模型对全局时空特征的感知能力。模型架构以时间卷积网络作为主体,每层时间卷积网络的操作可抽象为如下操作:其中为时间卷积第l层的特征序列,Conv(*)
k
表示卷积核大小为k的1维时间卷积,LayerNormal为层归一化操作,LeakyReLU为激活函数。T表示第l层特征序列的长度,c表示时空特征的特征通道数。第一层输入为X
h
,即原始交通时空序列。多尺度空间特征提取模块采用多组不同层数GCN构建块组成,每个GCN构建块包含两层GCN和一个GLU操作具体如下:其中为模型第l层的第i个时间片上的GCN构建块的输出。tanh为双曲正切函数,LeakyReLU操作中α为调整操作数x在小于等于0时的斜率调整系数。是第l层的第i个时间片上的交通特征。通过将多尺度空间特征提取模块的输出沿时间方向进行拼接得到:通过将多尺度空间特征提取模块的输出沿时间方向进行拼接得到:即模型第l层多尺度空间特征提取模块的输出。引入切比雪夫多项式来执行GCN操作:其中λ
max
为拉普拉斯矩阵L的最大特征值,表示缩放拉普拉斯矩阵。通过节点嵌入来从时空数据中自适应学习节点的向量表征形式,生成邻接矩阵用以执行图卷积操作。具体如下:其中表示节点嵌入矩阵,e为节点嵌入的维数,一般根据式(7)的方式进行选取。为根据节点嵌入生成的节点邻接矩阵。e=min{e|2
e
≥N}
ꢀꢀꢀꢀ
(6)
多元空间特征提取模块的最终输出在每层空间特征提取到局部时间特征和多尺度空间特征X
sl
之后,采用自注意力机制来提取模型的非局部时间相关性,具体步骤如下:其中X
Q
,X
K
以及X
V
...

【专利技术属性】
技术研发人员:白鑫珂宋云邓泽林范文东杨选正
申请(专利权)人:湖北武荆高速公路发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1