一种多因素的短时交通流预测方法技术

技术编号:20921277 阅读:20 留言:0更新日期:2019-04-20 10:41
本发明专利技术公开了一种多因素的短时交通流预测方法,包括步骤:1)计算特定检测器与气象站之间的距离,筛选出距离最近的气象站,将该气象站的天气数据作为检测器的天气数据;2)分别对检测器的历史交通流数据与历史天气数据进行预处理,再根据时间合并;3)构建多种特征,基于LightGBM进行特征筛选;4)利用LSTM对交通流数据的时序特征与周期性特征进行建模;5)使用神经网络中的全连接网络将交通流的时序特征、周期性特征与步骤3)筛选出来的多种特征进行融合;6)训练模型并对短时交通流进行预测。本发明专利技术克服了现有方法不能充分利用已有数据的不足,能对交通流数据进行更深入的挖掘分析,预测准确性高,鲁棒性好。

A Multi-factor Method for Short-term Traffic Flow Forecasting

The invention discloses a multi-factor short-term traffic flow forecasting method, which comprises the following steps: 1) calculating the distance between a specific detector and a meteorological station, screening out the nearest meteorological station, and using the weather data of the meteorological station as the weather data of the detector; 2) preprocessing the historical traffic flow data of the detector and the historical weather data respectively, and then merging them according to the time; Various features are screened based on LightGBM; 4) LSTM is used to model the temporal and periodic characteristics of traffic flow data; 5) Fusion of the temporal and periodic characteristics of traffic flow with the full-connected network of neural network; 6) Training model and prediction of short-term traffic flow. The invention overcomes the shortcoming that the existing method can not make full use of the existing data, can mine and analyze traffic flow data more deeply, has high prediction accuracy and good robustness.

【技术实现步骤摘要】
一种多因素的短时交通流预测方法
本专利技术涉及智能交通系统的
,特别涉及一种多因素的短时交通流预测方法。
技术介绍
随着经济的不断发展,交通压力日渐增大,交通事故频发,交通环境日益恶化。如何提高道路通行能力,缓解交通拥堵,是学术界及工业界关注的焦点。智能交通系统(ITS,IntelligentTransportSystem)将“人-路-车”紧密结合,建立起一个准确、实时、高效的交通管理系统。在ITS中,交通控制和实时交通流诱导尤为重要。而实现交通控制与诱导的关键就是实时准确的短时交通流预测。短时交通流预测起步阶段是使用古典统计方法预测单点交通状况;随后求和自回归移动平均(ARIMA,AutoregressiveIntegratedMovingAverage)等参数模型在一段时间内成为研究人员关注的焦点;由于交通流数据呈现出的随机性以及非线性,研究人员尝试使用非参数模型进行预测,如卡尔曼滤波法、最近邻算法、支持向量回归等,并取得一定的预测效果;但随着交通系统越来越复杂,数据规模逐渐膨胀,这些浅层模型已经逐渐不能满足预测需求。这促使我们思考如何充分挖掘交通流数据的隐含信息,深度信念网络、堆叠自编码器等深度网络结构相继应用于短时交通流预测领域。有研究人员利用长短时记忆网络(LSTM,LongShortTermMemoryNetworks)学习时序数据之间的关联关系,并获取长时依赖关系,但现有的方法没有充分考虑其他因素对预测结果的影响。本专利技术提出一种多因素的短时交通流预测方法,创新性地使用两个LSTM模块分别提取交通流的时序特征与周期性特征;并构建天气、时间等特征,筛选出其中重要度高的特征;使用全连接层(FC,FullyConnectedLayer)将交通流的时序特征、周期性特征与筛选出来的多种特征进行融合,从而达到提高预测准确性的目的。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提出了一种多因素的短时交通流预测方法,该方法创新性地使用两个LSTM模块分别提取交通流的时序特征与周期性特征,同时与天气特征、时间特征等融合,可克服现有方法不能充分利用已有数据的缺点,从而提高交通流预测的准确性。为实现上述目的,本专利技术所提供的技术方案为:一种多因素的短时交通流预测方法,包括以下步骤:1)计算特定检测器与气象站之间的距离,筛选出距离最近的气象站,将该气象站的天气数据作为检测器的天气数据;2)分别对检测器的历史交通流数据与历史天气数据进行预处理,再根据时间合并;其中,所述检测器的历史交通流数据为特定观测点在一段时间间隔内经过的车辆数;3)构建多种特征,基于LightGBM进行特征筛选;4)利用长短时记忆网络LSTM对交通流数据的时序特征与周期性特征进行建模;5)使用神经网络中的全连接网络将交通流的时序特征、周期性特征与步骤3)筛选出来的多种特征进行融合;6)训练模型并对短时交通流进行预测。在步骤1)中,需要根据经纬度计算检测器与不同气象站在地球表面的两点间距,选取距离检测器最近的气象站数据作为检测器天气数据,具体计算公式为:式中,d为检测器与气象站的距离,r为地球半径,和为检测器与气象站的纬度,λ1和λ2为检测器与气象站的经度。在步骤2)中,分别对检测器的历史交通流数据与历史天气数据进行预处理,再根据时间合并的具体过程如下:2.1)填充交通流数据缺失值,按照周一至周日将各天的交通流数据归为七类,计算每一类中一天所有时刻的平均值,用该平均值填充缺失值;2.2)填充天气数据缺失值,使用近邻时刻天气数据填充缺失值;2.3)对填充后的历史交通流数据进行归一化处理,提取最大交通流Fmax与最小交通流Fmin,使用最大最小归一化方法对历史交通流数据进行归一化处理,使得历史交通流数据映射到[0,1]的区间,归一化后的交通流数据Xt定义如以下公式所示:式中,Ft为t时刻的真实交通流;2.4)对填充后的历史天气数据初步筛选出温度、可见度、云层情况、风速、风向、降雨量和天气类型特征共七个特征;其中,对温度、风速、降雨量这些连续型特征按照步骤2.3)相同方法进行数据归一化处理,对可见度、云层情况、风向、天气类型这些离散型特征使用独热编码处理;2.5)根据时间将历史交通流数据与历史天气数据进行合并。在步骤3)中,构建多种特征,基于LightGBM进行特征筛选,具体过程如下:3.1)根据历史交通流数据产生时间生成以下特征:一小时内的第几分钟、一天内的第几小时、一周内的星期几、一月内的第几天、一年内的第几月、是否是节假日、是否是节假日前一天、是否是周末、是否是高峰期;3.2)获取检测器前一天同一时刻与前一周同一时刻的交通流数据;3.3)从历史天气数据中提取特征,包括是否是恶劣天气、是否是高温天气;3.4)利用LightGBM计算所有特征的重要度,剔除重要度低的特征。在步骤4)中,利用长短时记忆网络LSTM对交通流数据的时序特征与周期性特征进行建模,具体过程如下:4.1)利用LSTM对交通流数据的时序特征进行建模,根据预设值T设定LSTM的时间步,同时将交通流的长序列数据以滑动窗口的方式处理成适用于LSTM的输入格式,即预测t时刻交通流时,选取t-T,t-(T-1),...,t-1时刻的交通流作为LSTM输入;4.2)利用LSTM对交通流数据的周期性特征进行建模,根据预设值N设定LSTM的时间步,同时将交通流的长序列数据以滑动窗口的方式处理成适用于LSTM的输入格式,即预测t时刻交通流时,选取t-NM,t-(N-1)M,...,t-M时刻的交通流作为LSTM输入,M为一周的数据点个数。在步骤6)中,将预处理后的数据按照时间顺序分为两组,时间靠前的一组为训练集数据,时间靠后的一组为测试集数据;在训练集上进行训练,根据损失函数,计算模型所输出的预测值与交通流真实值的损失值,不断对模型进行迭代优化,得到最优模型;在测试集上,利用最优模型进行预测,验证模型有效性;将预测结果反归一化,得到预测值Pt,公式为:Pt=Yt(Fmax-Fmin)+Fmin式中,Fmax和Fmin分别为最大和最小交通流,Yt为模型预测结果;使用平均绝对百分比误差MAPE来验证模型的有效性,具体计算公式为:式中,n为预测总数,Pt为预测交通流,Ft真实交通流。本专利技术与现有技术相比,具有如下优点与有益效果:本专利技术方法能够充分挖掘交通流数据的时序特征以及周期性特征,创新性地使用两个长短时记忆神经网络(LSTM,LongShortTermMemoryNetworks)模块分别提取交通流的时序特征与周期性特征;并构建天气、时间等特征,筛选出其中重要度高的特征;使用全连接层将交通流的时序特征、周期性特征与筛选出来的多种特征进行融合,预测准确性高,鲁棒性好。附图说明图1是本专利技术方法流程框图。图2是交通流数据填充示意图。图3是本专利技术模型示意图。具体实施方式下面结合具体实施例和附图对本专利技术作进一步说明,应指出的是,所描述的实施例仅旨在便于对本专利技术的理解,而对其不起任何限定作用。如图1所示,本实施例所提供的多因素的短时交通流预测方法,包括以下步骤:步骤一,计算特定检测器与气象站之间的距离,筛选出距离最近的气象站,将该气象站的天气数据作为检测器的天气数据。本实施例检测器数据来源于PeM本文档来自技高网
...

【技术保护点】
1.一种多因素的短时交通流预测方法,其特征在于,包括以下步骤:1)计算特定检测器与气象站之间的距离,筛选出距离最近的气象站,将该气象站的天气数据作为检测器的天气数据;2)分别对检测器的历史交通流数据与历史天气数据进行预处理,再根据时间合并;其中,所述检测器的历史交通流数据为特定观测点在一段时间间隔内经过的车辆数;3)构建多种特征,基于LightGBM进行特征筛选;4)利用长短时记忆网络LSTM对交通流数据的时序特征与周期性特征进行建模;5)使用神经网络中的全连接网络将交通流的时序特征、周期性特征与步骤3)筛选出来的多种特征进行融合;6)训练模型并对短时交通流进行预测。

【技术特征摘要】
1.一种多因素的短时交通流预测方法,其特征在于,包括以下步骤:1)计算特定检测器与气象站之间的距离,筛选出距离最近的气象站,将该气象站的天气数据作为检测器的天气数据;2)分别对检测器的历史交通流数据与历史天气数据进行预处理,再根据时间合并;其中,所述检测器的历史交通流数据为特定观测点在一段时间间隔内经过的车辆数;3)构建多种特征,基于LightGBM进行特征筛选;4)利用长短时记忆网络LSTM对交通流数据的时序特征与周期性特征进行建模;5)使用神经网络中的全连接网络将交通流的时序特征、周期性特征与步骤3)筛选出来的多种特征进行融合;6)训练模型并对短时交通流进行预测。2.根据权利要求1所述的一种多因素的短时交通流预测方法,其特征在于:在步骤1)中,需要根据经纬度计算检测器与不同气象站在地球表面的两点间距,选取距离检测器最近的气象站数据作为检测器天气数据,具体计算公式为:式中,d为检测器与气象站的距离,r为地球半径,和为检测器与气象站的纬度,λ1和λ2为检测器与气象站的经度。3.根据权利要求1所述的一种多因素的短时交通流预测方法,其特征在于:在步骤2)中,分别对检测器的历史交通流数据与历史天气数据进行预处理,再根据时间合并的具体过程如下:2.1)填充交通流数据缺失值,按照周一至周日将各天的交通流数据归为七类,计算每一类中一天所有时刻的平均值,用该平均值填充缺失值;2.2)填充天气数据缺失值,使用近邻时刻天气数据填充缺失值;2.3)对填充后的历史交通流数据进行归一化处理,提取最大交通流Fmax与最小交通流Fmin,使用最大最小归一化方法对历史交通流数据进行归一化处理,使得历史交通流数据映射到[0,1]的区间,归一化后的交通流数据Xt定义如以下公式所示:式中,Ft为t时刻的真实交通流;2.4)对填充后的历史天气数据初步筛选出温度、可见度、云层情况、风速、风向、降雨量和天气类型特征共七个特征;其中,对温度、风速、降雨量这些连续型特征按照步骤2.3)相同方法进行数据归一化处理,对可见度、云层情况、风向、天气类型这些离散型特征使用独热编码处理;2.5)根据时间将历史交通流数据与历史天气数据进行合并。4.根据权利要求1...

【专利技术属性】
技术研发人员:陈泽濠袁华
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1