基于数据质量控制的道路网重型货车交通流量预测方法技术

技术编号:25401414 阅读:30 留言:0更新日期:2020-08-25 23:05
本发明专利技术涉及一种基于数据质量控制的道路网重型货车交通流量预测方法,针对GPS流量数据及收费站监测数据两种数据源划分三类数据路段,分别采取不同的预测方法。针对有GPS流量数据的路段,由于GPS数据存在获取不够全样问题,采用先分段常系数法扩样再长短时循环神经网络预测的方法。针对无GPS数据的无数据路段,采用K最近邻算法预测流量。针对收费站监测数据路段,由于数据样本全面,直接采取长短时循环神经网络算法进行预测。本发明专利技术从流量预测面对的实际工程问题出发,分析多种数据来源特征来提高数据质量,进而建立路网重型货车流量测算方法,最终形成基于数据质量控制的道路网重型货车流量。

【技术实现步骤摘要】
基于数据质量控制的道路网重型货车交通流量预测方法
本专利技术涉及智能交通领域,具体涉及一种基于数据质量控制的道路网重型货车交通流量预测方法。
技术介绍
近年来,重型货车增比逐年上升。基于现有的道路资源,重型货车的增加会导致车辆拥堵现象并影响居民的日常出行,货车与客车的交通矛盾十分突出。管理部门常常采取特殊时段限行等政策来进行调控,但往往由于数据缺失和理论支撑不足等问题导致政策效果不佳。充分利用多种数据,采取科学的理论方法,对重型货车交通流进行准确的预测,可以为解决全路网重型货车拥堵等问题提供理论支持。目前,多源化的数据给精准的交通流量预测带来可能的同时也对交通流量预测方法提出了更高要求。重型货车由于政策要求必须安装GPS定位仪,因此可以实时监测车辆的运动轨迹,实现对有GPS数据路段的预测。但是现实中常常存在定位仪安装覆盖面不全、仪器损坏、通讯干扰、线路故障、采集频率混乱、环境影响等原因导致原始数据缺失,需要对无数据路段和有GPS交通流量数据路段进行交通流量预测。此外,收费站数据收集的便利性,可以对监测数据路段的重型货车交通流量进行预测,进而获得全路网货车交通流量。上述三类路段数据具有质量不同和类型不同的特点,为了提高预测效果,需要分别挖掘数据特征,采用不同的方法进行针对性的预测。已有研究往往仅针对某一种路段进行分析和预测,研究不够全面,普适性不强。本方法更加全面的考虑实际工程问题,更具有实际应用价值,在整体路网的交通流预测中,重型货车的交通流量与实际流量更为接近,便于重型货车管控策略为规划人员和管理人员及时制定可靠的措施提供了理论参考依据,进而更有效的减少车祸和交通拥堵。
技术实现思路
为克服上述的问题,本专利技术目的在于提供一种基于数据质量控制的道路网重型货车交通流量预测方法。本专利技术通过以下方法达到目的:一种基于数据质量控制的道路网重型货车交通流量预测方法,包括如下步骤:步骤1:通过重型货车的车载卫星定位装置,获得重型货车的GPS轨迹数据;步骤2:将GPS轨迹数据根据经纬度定位到所属的路网路段上,按照指定时间间隔进行合并,得到城市路网上每个路段的小时重型货车交通流量,筛选出有GPS交通流量数据路段和无数据路段;步骤3:收集收费站每小时所监测的重型货车出、入口流量及断面流量,形成监测数据路段;步骤4:对步骤2筛选出的有GPS交通流量数据路段采用分段常系数法扩样及长短时循环神经网络方法进行流量预测;步骤5:对步骤2筛选出的无数据路段采用构建K最近邻方法进行流量预测;步骤6:对步骤3形成的监测数据路段采用长短时循环神经网络方法进行流量预测。步骤7:汇总步骤4、步骤5、步骤6的流量预测结果,得到全路网预测流量。在上述方案的基础上,步骤1所述GPS轨迹数据包括:记录时间、经度、纬度以及车牌号;在上述方案的基础上,所述步骤2具体包括:将城市路网进行编号形成路段ID,将每个路段ID按照1h的时间间隔将GPS数据进行合计,形成带有路段属性和时间间隔属性的交通流量数据,筛选出有GPS交通流量数据路段和无数据路段,所述有GPS交通流量数据路段为:有GPS数据的路段;所述无数据路段为:无GPS数据的路段。在上述方案的基础上,步骤3所述断面流量为出、入口流量之和。在上述方案的基础上,步骤4具体包括如下步骤:步骤41:对步骤2筛选出的有GPS交通流量数据路段按照道路等级和流量范围采用分段常系数法进行扩样。步骤42:对扩样后的数据进行标准化处理。步骤43:利用长短时循环神经网络方法进行交通流量预测。步骤44:将预测后的交通流量进行反标准化处理。步骤45:将反标准化后的数据与交通调查数据进行对比。步骤46:采用总量控制法进行重型货车交通流量调整。在上述方案的基础上,步骤41所述道路等级包括公路等级和城市道路等级,从公路等级和城市道路等级两方面细分10个等级;所述公路等级包括:高速公路、一级公路、二级公路、三级公路、四级公路;所述城市道路等级包括:快速路、主干路、次干路、支路、其他,所述其他代表不属于上述城市道路等级的其余路段。在上述方案的基础上,步骤41具体包括如下步骤:步骤411:将所有路段交通流量按照时间间隔进行合计;步骤412:选择合计后最大流量的时段作为排序依据,将所有路段ID的交通流量进行降序排序;步骤413:将排序后交通流量所呈现的分布函数进行参数估计,yi=ke-ax+b(1)其中,yi代表路段i的流量,x代表降序后的路段序列,k、a、b代表分布函数的估计参数;步骤414:将所有路段按照流量进行区间分段,根据概率密度函数计算该区间下的扩样系数。其中,mi,j为路段序号[i,j]区间的扩样系数。xi,xj代表序列为i,j的路段序列编号。在上述方案的基础上,步骤42具体为:将路段ID所有流量进行筛选,选出最大交通流量,将每个交通流量与该最大交通流量的比值归一化到[0,1]区间中。在上述方案的基础上,步骤43具体包括如下步骤:步骤431:将所有交通流量数据分为训练集和测试集。步骤432:设定参数。步骤433:模型训练和调参,将模型训练到最佳状态。步骤434:重型货车交通流量预测,将训练好的模型对测试集数据进行预测,并采用平均绝对误差(MAE)、百分比误差(MAPE)、均方根误差(RMSE)、解释方差分数(EVS)进行模型效果评估。解释方差分数(EVS)计算公式为:其中,Yt为t时刻的交通流量,为t时刻的预测交通流量。在上述方案的基础上,步骤432所述参数包括:隐藏层units大小,时间步长timesteps,每次输入样本数batch_size,激活函数,损失函数,循环步数epotch。在上述方案的基础上,步骤5具体包括如下步骤:步骤51:选取道路等级、车道数与宽度作为自变量,路段的交通流量作为因变量,形成数据集;步骤52:计算目标路段与其他有流量数据路段之间的欧式距离;步骤53:按照欧式距离进行降序排序;步骤54:选取欧式距离最小的K组数据,将K组数据的因变量值,取平均值即可表示目标路段重型货车流量值,所述因变量值为路段货车流量。步骤55:最后对预测结果进行评估,将均方差作为误差评估指标,当误差仍较大时,可采取更改K值的方式,使预测结果更加接近于真实情况。在上述方案的基础上,步骤6所述对监测数据路段采用长短时循环神经网络方法的具体步骤与步骤43相同。本专利技术的有益效果:本专利技术所述一种基于数据质量控制的道路网重型货车交通流量预测方法,从多角度考虑多种数据类型和质量情况下的流量预测,从工程实践出发,以GPS交通流量数据和监测交通流数据的为依托,结合实际情况分析数据特点,提出针对性预测方法可以更加准确地刻画未来重型货车交通流量实际数量。为缓解重型货车交通拥本文档来自技高网
...

【技术保护点】
1.一种基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,包括如下步骤:/n步骤1:通过重型货车的车载卫星定位装置,获得重型货车的GPS轨迹数据;/n步骤2:将GPS轨迹数据根据经纬度定位到所属的路网路段上,按照指定时间间隔进行合并,得到城市路网上每个路段的小时重型货车交通流量,筛选出有GPS交通流量数据路段和无数据路段;/n步骤3:收集收费站每小时所监测的重型货车出、入口流量及断面流量,形成监测数据路段;/n步骤4:对步骤2筛选出的有GPS交通流量数据路段采用分段常系数法扩样及长短时循环神经网络方法进行流量预测;/n步骤5:对步骤2筛选出的无数据路段采用构建K最近邻方法进行流量预测;/n步骤6:对步骤3形成的监测数据路段采用长短时循环神经网络方法进行流量预测;/n步骤7:汇总步骤4、步骤5、步骤6的流量预测结果,得到全路网预测流量。/n

【技术特征摘要】
1.一种基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,包括如下步骤:
步骤1:通过重型货车的车载卫星定位装置,获得重型货车的GPS轨迹数据;
步骤2:将GPS轨迹数据根据经纬度定位到所属的路网路段上,按照指定时间间隔进行合并,得到城市路网上每个路段的小时重型货车交通流量,筛选出有GPS交通流量数据路段和无数据路段;
步骤3:收集收费站每小时所监测的重型货车出、入口流量及断面流量,形成监测数据路段;
步骤4:对步骤2筛选出的有GPS交通流量数据路段采用分段常系数法扩样及长短时循环神经网络方法进行流量预测;
步骤5:对步骤2筛选出的无数据路段采用构建K最近邻方法进行流量预测;
步骤6:对步骤3形成的监测数据路段采用长短时循环神经网络方法进行流量预测;
步骤7:汇总步骤4、步骤5、步骤6的流量预测结果,得到全路网预测流量。


2.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤1所述GPS轨迹数据包括:记录时间、经度、纬度以及车牌号。


3.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,所述步骤2具体包括:将城市路网进行编号形成路段ID,将每个路段ID按照1h的时间间隔将GPS数据进行合计,形成带有路段属性和时间间隔属性的交通流量数据,筛选出有GPS交通流量数据路段和无数据路段,所述有GPS交通流量数据路段为:有GPS数据的路段;所述无数据路段为:无GPS数据的路段。


4.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤3所述断面流量为出、入口流量之和。


5.如权利要求1所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤4具体包括如下步骤:
步骤41:对步骤2筛选出的有GPS交通流量数据路段按照道路等级和流量范围采用分段常系数法进行扩样;
步骤42:对扩样后的数据进行标准化处理;
步骤43:利用长短时循环神经网络方法进行交通流量预测;
步骤44:将预测后的交通流量进行反标准化处理;
步骤45:将反标准化后的数据与交通调查数据进行对比;
步骤46:采用总量控制法进行重型货车交通流量调整。


6.如权利要求5所述的基于数据质量控制的道路网重型货车交通流量预测方法,其特征在于,步骤41所述道路等级包括公路等级和城市道路等级,从公路等级和城市道路等级两方面细分10个等级;
所述公路等级包括:高速公路、一级公路、二级公路、三级公路、四级公路;

【专利技术属性】
技术研发人员:王晟由诸葛承祥董春娇邵春福赵晋
申请(专利权)人:北京交通大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1