基于组归一化和网格化协同的交通流预测方法技术

技术编号:24211004 阅读:91 留言:0更新日期:2020-05-20 16:51
本发明专利技术提供一种基于组归一化和网格化协同的交通流预测方法,通过获取交通流量数据,将交通流量数据进行预处理;将预处理后的数据,分成g组,每组样本数为m,形成m×F的向量;对每组样本数据进行向量格式转换,即将m×F的向量转换成M×T×F向量,其中T为时间间隔,M是T时间间隔内的样本数,F是特征数,并进行组归一化操作;将每组样本组归一化后的样本分为训练样本和测试样本,样本数分别为N和n;将得到的训练样本代入网格循环网络;最后经过线性判决得到最优的交通流量预测模型。本发明专利技术主要贡献在于循环网络中解决了LSTM和GRU后一时刻需要等待前一时刻输出的弊端,简化了模型,节约了计算资源。

Traffic flow prediction method based on group normalization and grid cooperation

【技术实现步骤摘要】
基于组归一化和网格化协同的交通流预测方法
本专利技术涉及一种基于组归一化和网格化协同的交通流预测方法。
技术介绍
随着社会的发展,大都市的车辆数量急剧增加,准确及时的交通流预测对于个人,企业及政府机构来说显得日益重要,它能够帮助居民做出更好的出行决策,缓解交通拥塞,减少碳排量,提高交通运营效率。为了减轻繁忙的交通状况,可以考虑两种方式。一是通过扩大现有道路上的车道数量来扩大道路网总容量。然而,这需要额外的土地和基础设施的巨额支出,这在许多城市地区往往是不可行的。另一种方式是使用各种交通控制策略,以便有效地利用现有的道路网络。这种方法不需要太多支出,并且在大多数情况下是可行的,因此在现实中此方法更实用。控制策略通常是指交通预测技术,以预测潜在的拥堵,从而指引人们制定更合适的出行路线,缓解交通拥堵。因此,准确的交通流预测一方面可以为出行者提供准确的路况信息,从而有效地避免拥堵路段,节约出行时间。另一方面交通管理部门可以利用交通流预测的结果提前进行交通疏导,避免某一路段过于拥堵。从而能够降低燃料成本和减少空气污染,因而交通流预测已成为交通管理部门采取交通控制主要依据,是智能交通系统(ITS)的重要组成部分。在过去的几十年中,许多时间序列预测方法被提出用以解决短期交通流量预测,包括基于历史平均值和平滑度的模型,基于统计和回归的方法,基于交通流理论的方法和机器学习技术。以上这些方法可分为两类,参数化方法和非参数化方法。在参数化方法中,自回归积分移动平均(ARIMA)被广泛认为是一种可以用于交通流量预测的模型,在过去几十年中,许多根据ARIMA模型改进的方法被提出。ARIMA虽然模型十分简单,但要求时序数据是稳定的或者通过差分后是稳定的,如果是非平稳的数据,是无法捕捉到规律的,其本质上只能捕捉到线性关系,这种参数化技术可以在常规波动下处理数据,但是,现实中涉及到的时间序列数据通常是没有常规变化,并易受外部因素的影响使得交通流模型预测的准确度受到了很大的挑战。在这种背景下,非参数化方法得到广泛运用如支持向量回归(SVR)不仅适用于线性模型,也能很好的抓住数据和特征之间的非线性关系,不需要考虑多重共线性问题,可以避免局部极小值问题,提高泛化性能,解决高维问题,但是计算复杂度高,在面临数据量大的时候,计算耗时,给交通流预测的实时性带来挑战。前馈神经网络实现了一个从输入到输出的映射功能,能够以任何精度逼近非线性连续函数,在训练时,能够通过学习自动提取特征、标签之间的“规则”,具有较高泛化能力和容错能力,但训练时间可能非常长,网络往往存在很大的冗余,增加了网络学习的负担并且网络的学习和记忆具有不稳定的特点,增加了交通流预测的不稳定性。梯度提升回归树通过合并许多简单的模型使得模型占用的内存更少,预测速度也更快,然而,会对参数设置很敏感,如果参数设置错误的话,交通流模型准确度通常会很低,所以此模型给交通流预测结果带来了不确定性。上述问题是在交通流量预测模型的建立过程中应当予以考虑并解决的问题。
技术实现思路
本专利技术的目的是提供一种基于组归一化和网格化协同的交通流预测方法解决现有技术中存在的所得交通流预测模型计算耗时、计算资源的损耗较大的问题。本专利技术的技术解决方案是:一种基于组归一化和网格化协同的交通流预测方法,包括以下步骤:S1、将获取的交通流量数据进行预处理;S2、将步骤S1处理后的数据,分成g组,每组的样本数为m,形成m×F的向量;S3、对步骤S2所得的g组中每组样本数据进行向量格式转换,即将m×F的向量转换成M×T×F向量,其中T为时间间隔,M是T时间间隔内的样本数,F是特征数,并进行组归一化操作;S4、将g组中分别进行步骤S3的组归一化操作后得到的每组样本分为训练样本和测试样本,每组的样本数分别为N和n,此时每组训练样本是N×T×F维的向量;S5、将g组中步骤S4得到的每组训练样本分别代入网格循环网络中,得到g个交通流量预测模型,将所得g个交通流量预测模型经过线性判决器得到最优的交通流量预测模型。进一步地,步骤S5的具体步骤如下:S51、定义初始值,即定义初始记忆单元C0和初始掩藏层H0;记忆单元C0为t=1时刻,取值范围在0-0.01之间满足标准正太分布的K×T×F维向量,掩藏层H0为t=1时刻,取值范围在0-0.01之间满足标准正太分布的K×1维向量;S52、将步骤S51定义的C0和H0进行网格化处理,使得输出的记忆单元C′0带有掩藏层H0的信息;网格化处理的本质是进行向量格式转换;S53、将步骤S52得到的记忆单元C′0代入组1所在的循环网络中,得到记忆单元C1和掩藏层输出H1;S531、计算ft,ft是循环网络中的中间输出函数,其主要作用是决定上一时刻的信息保留到当前记忆单元ct的信息量,其表达式为:ft=σ(Wf(t-1)Xt+bf(t-1)),其中σ为Sigmoid激活函数,其表达式为:s(x)=1/1+e-x,常被用作神经网络的阈值函数,能够将变量映射到0,1之间;Xt是t时刻的训练样本输入,此输入是一个N×T×F维向量,T为时间间隔,N是T时间间隔内的训练样本数,F是特征数;Wf(t-1)为t时刻Xt与ft的权重参量,是一个取值范围在0-0.01之间满足标准正太分布的K×N维向量;bf(t-1)为t时刻Xt与ft的偏置参量,是一个取值范围在0-0.01之间满足标准正太分布的K×1维向量;当t=1时刻,此时Wf(t-1)=Wf0,bf(t-1)=bf0,Xt=X1为N×1×F维向量,即f1=σ(Wf0X1+bf0);S532、计算记忆单元ct,ct在循环网络中既是中间函数又是最终输出,其主要作用决定了每一时刻保留到循环网络中的信息量,其表达式为:ct=ft·ct-1。ft为t时刻循环网络中中间输出函数,ct-1为相对于t时刻的上一时刻的记忆单元;当t=1时刻,c1=f1·c0,其中c0=C′0。S533、计算rt,rt也是循环网络中的中间输出函数,其主要作用决定了训练样本输入Xt保留到循环网络的信息量,其表达式为:rt=tanh(Wr(t-1)Xt+br(t-1)),其中tanh是激活函数,其表达式为:S(x)=(ex-e-x)/(ex+e-x),Wr(t-1)是t时刻Xt与rt的权重参量,是一个取值范围在0-0.01之间满足标准正太分布的K×N维向量。bf(t-1)为t时刻Xt与rt的偏置参量,是一个取值范围在0-0.01之间满足标准正太分布的K×1维向量。当t=1时,此时Wr(t-1)=Wr0,br(t-1)=br0,Xt=X1为N×1×F维向量,即r1=tanh(Wr0X1+br0);S534、计算掩藏层输出ht,其表达式为:ht=k(ct)+rt·Xt,因此掩藏层输出ht只依赖于t时刻的记忆单元ct和t时刻的训练样本输入Xt;其中k(x)表示卷积核函数;当t=1时,h1=k(c1)+r1X1;S535、依次遍历步骤S531-S534,遍历T次,当t本文档来自技高网
...

【技术保护点】
1.一种基于组归一化和网格化协同的交通流预测方法,其特征在于,包括以下步骤:/nS1、将获取的交通流量数据进行预处理;/nS2、将步骤S1处理后的数据,分成g组,每组的样本数为m,形成m×F的向量;/nS3、对步骤S2所得的g组中每组样本数据进行向量格式转换,即将m×F的向量转换成M×T×F向量,其中T为时间间隔,M是T时间间隔内的样本数,F是特征数,并进行组归一化操作;/nS4、将g组中分别进行步骤S3的组归一化操作后得到的每组样本分为训练样本和测试样本,每组的样本数分别为N和n,此时每组训练样本是N×T×F维的向量;/nS5、将g组中步骤S4得到的每组训练样本分别代入网格循环网络中,得到g个交通流量预测模型,将所得g个交通流量预测模型经过线性判决器得到最优的交通流量预测模型。/n

【技术特征摘要】
1.一种基于组归一化和网格化协同的交通流预测方法,其特征在于,包括以下步骤:
S1、将获取的交通流量数据进行预处理;
S2、将步骤S1处理后的数据,分成g组,每组的样本数为m,形成m×F的向量;
S3、对步骤S2所得的g组中每组样本数据进行向量格式转换,即将m×F的向量转换成M×T×F向量,其中T为时间间隔,M是T时间间隔内的样本数,F是特征数,并进行组归一化操作;
S4、将g组中分别进行步骤S3的组归一化操作后得到的每组样本分为训练样本和测试样本,每组的样本数分别为N和n,此时每组训练样本是N×T×F维的向量;
S5、将g组中步骤S4得到的每组训练样本分别代入网格循环网络中,得到g个交通流量预测模型,将所得g个交通流量预测模型经过线性判决器得到最优的交通流量预测模型。


2.如权利要求1述的基于组归一化和网格化协同的交通流预测方法,其特征在于:步骤S5的具体步骤如下:
S51、定义初始值,即定义初始记忆单元C0和初始掩藏层H0;记忆单元C0为t=1时刻,取值范围在0-0.01之间满足标准正太分布的K×T×F维向量,掩藏层H0为t=1时刻,取值范围在0-0.01之间满足标准正太分布的K×1维向量;
S52、将步骤S51定义的C0和H0进行网格化处理,使得输出的记忆单元C′0带有掩藏层H0的信息;网格化处理的本质是进行向量格式转换;
S53、将步骤S52得到的记忆单元C′0代入组1所在的循环网络中,得到记忆单元C1和掩藏层输出H1;
S531、计算ft,ft是循环网络中的中间输出函数,其主要作用是决定上一时刻的信息保留到当前记忆单元ct的信息量,其表达式为:ft=σ(Wf(t-1)Xt+bf(t-1)),其中σ为Sigmoid激活函数,其表达式为:s(x)=1/1+e-x,常被用作神经网络的阈值函数,能够将变量映射到0,1之间;Xt是t时刻的训练样本输入,此输入是一个N×T×F维向量,T为时间间隔,N是T时间间隔内的训练样本数,F是特征数;Wf(t-1)为t时刻Xt与ft的权重参量,是一个取值范围在0-0.01之间满足标准正太分布的K×N维向量;bf(t-1)为t时...

【专利技术属性】
技术研发人员:暴建民翟英明丁飞姚亮宇张海涛
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1