一种基于超长时间序列的交通数据预测方法技术

技术编号:20822136 阅读:39 留言:0更新日期:2019-04-10 06:32
本发明专利技术涉及一种基于超长时间序列的交通数据预测方法,首先,对历史交通数据进行位置标记处理,对历史交通数据进行位置标记处理的方法如下:确定交通数据超长时间序列中单个数据位置与超长时间序列形成的数据空间的对应关系;根据对应关系对交通数据超长时间序列中的交通数据作位置标记;所述超长时间序列指跨越多个划分时段的时间序列;最后,选取带位置标记的历史交通数据作为输入数据,进行交通数据预测。交通数据预测时采用神经网络模型方法、移动平均法、指数平滑法、AR模型法中任意的一种方法。本发明专利技术通过感知交通数据超长时间序列中数据位置的相关性,提高交通数据预测精度。

【技术实现步骤摘要】
一种基于超长时间序列的交通数据预测方法
本专利技术涉及交通数据预测领域,尤其涉及一种基于超长时间序列的交通数据预测方法。
技术介绍
实时动态交通的发展,使得实时准确的交通数据成为热门。然而,交通数据受时间因素的影响很大。主要分为主动因素和被动因素。主动因素有:工作日与非工作日、季节性变换、时间推移等。被动因素有:节假日、引导车流量变化的活动等。交通数据时间序列可以按照分钟、小时、天、周、月、年等时段划分,交通数据预测主要利用历史时间段的交通数据进行未来时间段的交通数据预测。现有的交通预测方法,如移动平均法、指数平滑法、AR模型法等,对跨越多个划分时段的超长时间序列的感知较弱;因此设计一种基于超长时间序列的交通数据预测方法是有必要的。
技术实现思路
本专利技术为克服上述的不足之处,目的在于提供一种基于超长时间序列的交通数据预测方法,本专利技术通过感知交通数据超长时间序列中数据位置的相关性,提高交通数据预测精度。本专利技术是通过以下技术方案达到上述目的:一种基于超长时间序列的交通数据预测方法,包括如下步骤:(1)对历史交通数据进行位置标记处理,其中进行位置标记处理的方法如下:(1.1)确定交通数据超长时间序列中单个数据位置与超长时间序列形成的数据空间的对应关系;(1.2)根据对应关系对交通数据超长时间序列中的交通数据作位置标记;所述超长时间序列指跨越多个划分时段的时间序列;(2)选取带位置标记的历史交通数据作为输入数据,进行交通数据预测。作为优选,所述步骤(1.1)中采用回归模型方法、用户设置方法、神经网络模型方法中的任意一种方法均可确定交通数据超长时间序列中单个数据位置与超长时间序列形成的数据空间的对应关系;优选采用回归模型方法,公式如下:Q=∑(y-∑(wpxp+bp))=min其中,y为单个数据位置上的交通数据,p表示数据空间位置,求使得Q函数最小化的w、b,作为单个数据位置与数据空间的对应关系。作为优选,所述步骤(1.2)中根据对应关系对交通数据超长时间序列中的交通数据作位置标记,其中采用回归模型获取w、b,根据w的大小,划分不同级别,作为位置标记。作为优选,所述的划分时段根据交通数据呈现的周期性现象来确定,选择多组以时间窗为单位的交通数据时间序列,求平均相似度,当平均相似度满足设定的阈值时,该时间窗可作为划分时段;其中相似度可通过余弦相似度、皮尔森相关系数、Jaccard相似系数方法计算得到。作为优选,所述步骤(2)中采用神经网络模型方法、移动平均法、指数平滑法、AR模型法中任意的一种方法进行交通数据预测。作为优选,所述交通数据包括但不限于交通设备采集的数据、根据交通设备采集的数据换算的数据;所述交通设备采集的数据包括但不限于交通流量、交通速度,所述根据交通设备采集的数据换算的数据,包括但不限于交通状态、交通指数。作为优选,所述的神经网络模型方法优选采用LSTM长短时神经网络进行交通数据预测,具体如下:(i)通过设定输入的驱动序列进行交通流量预测,对预测值与远距离的交通流量值建立线性回归模型;(ii)训练后筛选出位置标记满足要求的流量值,并对筛选得到的权重大的远处流量值位置进行标记;(iii)将带位置标记的带有权重的交通流量值加入LSTM网络输入层中,进行LSTM+的反向传播训练,首先前向计算每个神经元的输出值,其次反向计算每个神经元的误差项值,最后根据相应的误差项,计算每个权重的梯度,更新权重值;(iv)用训练好的LSTM网络模型预测在未来预设时期内的交通流量。作为优选,所述在步骤(i)中,设定输入的驱动序列为X=(x1,1,1,x1,1,2,...,xkk,nn,mm,ykk,nn+1,1,ykk,nn+1,2,...,ykk,nn+1,t-1,),其中,y表示预测当天的数据,流量预测问题实质为通过驱动序列X建立与预测流量ykk,nn+1,t的映射。作为优选,所述步骤(i)在建立线性回归模型时,选取每天t时间间隔附近的数据,回归模型如下:其中,d为步长,和b分别是回归模型的权重和偏置。作为优选,所述LSTM网络是一种特殊的RNN循环神经网络,与RNN相比,增加了“输入门”,“遗忘门”,“输出门”,“输入门”,“遗忘门”,“输出门”,以及LSTM细胞状态如下所示:输入门:遗忘门:细胞状态:输出门:其中,I代表输入当前序列的长度,C表示LSTM细胞的数量,P表示被标记的高影响车流量值的数量,l表示输入状态,表示遗忘门的状态,o表示输出门的状态,f和g是激活函数,表示t时刻第c个细胞状态值,tgp表示第p个带有权重的被标记的车流量值,最后输出为:本专利技术的有益效果在于:本专利技术通过感知交通数据超长时间序列中数据位置的相关性,标记数据位置重要性,再将这些位置的交通数据进行筛选,作为交通数据预测的基础,提高了交通数据预测精度。优选地,将重要位置的车流量值加入到LSTM中,使LSTM模型不仅具备长短期记忆功能,而且对于超长期也有一定的记忆功能,从而使得交通流量预测更加精准。附图说明图1是本专利技术方法的流程示意图。具体实施方式下面结合具体实施例对本专利技术进行进一步描述,但本专利技术的保护范围并不仅限于此:实施例1:如图1所示,一种基于超长时间序列的交通数据预测方法包括如下步骤:(1)对历史交通数据进行位置标记处理,其中,进行位置标记处理的方法如下:(1.1)确定交通数据超长时间序列中单个数据位置与超长时间序列形成的数据空间的对应关系;(1.2)根据对应关系对交通数据超长时间序列中的交通数据作位置标记;所述超长时间序列指跨越多个划分时段的时间序列;其中交通数据包括交通设备采集的数据,如交通流量、交通速度等,根据交通设备采集的数据换算的数据,如交通状态、交通指数等。超长时间序列指跨越多个划分时段的时间序列,如:4个划分时段分别为1分钟、1小时、1天、1周,x[k,m,n,l]表示第k周第m天第n小时第l分钟的交通数据,k、m、n、l为整数,k可选范围[1-K],m可选范围[1-M],1<M<8,n可选范围[1-N],1<N<25,l可选范围[1-L],1<L<61;超长时间序列由于不同的划分时段,形成了数据空间[1-K,1-M,1-N,1-L],[k,m,n,l]对应了其中某一数据空间位置。类似,跨越3个划分时段的时间序列也形成超长时间序列。划分时段根据交通数据呈现的周期性现象来确定,选择多组以时间窗为单位的交通数据时间序列,求平均相似度,当平均相似度满足设定阈值时,该时间窗可以作为划分时段。在本实施例中,获得一组历史交通数据集:{(x1,t1),(x2,t2),…(xj,tj),…,(x300,t300)},t2-t1为1小时,时间窗TK为12小时,取多组以TK为单位的交通数据时间序列,以3组为例,xTK1={x1,x2,…,x12},xTK2={x25,x26,…,x37},xTK3={x13,x14,…,x24},可以按12小时间隔顺序选取,或随机选取。相似度可以采用余弦相似度、皮尔森相关系数、Jaccard相似系数等方法计算。S<xTK1,xTK2>为时间序列xTK1和xTK2的相似度。求平均相似度STK=(S<xTK1,xTK2>+S<xTK1,xTK本文档来自技高网...

【技术保护点】
1.一种基于超长时间序列的交通数据预测方法,其特征在于包括如下步骤:(1)对历史交通数据进行位置标记处理,其中进行位置标记处理的方法如下:(1.1)确定交通数据超长时间序列中单个数据位置与超长时间序列形成的数据空间的对应关系;(1.2)根据对应关系对交通数据超长时间序列中的交通数据作位置标记;所述超长时间序列指跨越多个划分时段的时间序列;(2)选取带位置标记的历史交通数据作为输入数据,进行交通数据预测。

【技术特征摘要】
1.一种基于超长时间序列的交通数据预测方法,其特征在于包括如下步骤:(1)对历史交通数据进行位置标记处理,其中进行位置标记处理的方法如下:(1.1)确定交通数据超长时间序列中单个数据位置与超长时间序列形成的数据空间的对应关系;(1.2)根据对应关系对交通数据超长时间序列中的交通数据作位置标记;所述超长时间序列指跨越多个划分时段的时间序列;(2)选取带位置标记的历史交通数据作为输入数据,进行交通数据预测。2.根据权利要求1所述的一种基于超长时间序列的交通数据预测方法,其特征在于:所述步骤(1.1)中采用回归模型方法、用户设置方法、神经网络模型方法中的任意一种方法均可确定交通数据超长时间序列中单个数据位置与超长时间序列形成的数据空间的对应关系;优选采用回归模型方法,公式如下:Q=∑(y-∑(wpxp+bp))=min其中,y为单个数据位置上的交通数据,p表示数据空间位置,求使得Q函数最小化的w、b,作为单个数据位置与数据空间的对应关系。3.根据权利要求1所述的一种基于超长时间序列的交通数据预测方法,其特征在于:所述步骤(1.2)中根据对应关系对交通数据超长时间序列中的交通数据作位置标记,其中采用回归模型获取w、b,根据w的大小,划分不同级别,作为位置标记。4.根据权利要求1所述的一种基于超长时间序列的交通数据预测方法,其特征在于:所述的划分时段根据交通数据呈现的周期性现象来确定,选择多组以时间窗为单位的交通数据时间序列,求平均相似度,当平均相似度满足设定的阈值时,该时间窗可作为划分时段;其中相似度可通过余弦相似度、皮尔森相关系数、Jaccard相似系数方法计算得到。5.根据权利要求1所述的一种基于超长时间序列的交通数据预测方法,其特征在于:所述步骤(2)中采用神经网络模型方法、移动平均法、指数平滑法、AR模型法中任意的一种方法进行交通数据预测。6.根据权利要求1所述的一种基于超长时间序列的交通数据预测方法,其特征在于:所述交通数据包括但不限于交通设备采集的数据、根据交通设备采集的数据换算的数据;所述交通设备采集的数据包括但不限于交通流量、交通速度,所述根...

【专利技术属性】
技术研发人员:李建元章步镐杨柏林陆俊杰田彦
申请(专利权)人:银江股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1