当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于时空宽度学习的交通速度预测方法技术

技术编号:19826900 阅读:19 留言:0更新日期:2018-12-19 16:36
本发明专利技术公开了一种基于时空宽度学习的交通速度预测方法。该方法充分考虑了交通速度的时间特性和空间特性,同时考虑了天气和节假日的影响,并引入宽度学习的思想建立预测模型。时间特性方面,本方法提取了速度信号的时序慢特征作为特征节点。空间特性方面,本方法提出了一种滑动窗口相关系数法搜寻对预测路段速度有影响的相关路段,并将这些路段的速度数据作为扩展自变量引入模型。本方法在引入宽度学习思想建立预测模型的同时引入L1和L2正则化对特征进行稀疏选择,防止模型的过拟合。本方法考虑了时空特性,具有很强的可解释性,相比传统的预测方法,提高了预测精度,而且一定程度缩短了建模时间,为交通速度预测方法的研究指明了新的方向。

【技术实现步骤摘要】
一种基于时空宽度学习的交通速度预测方法
本专利技术属于交通时序数据分析和预测研究领域,特别是涉及一种基于时空相关性和宽度学习的交通速度预测方法。
技术介绍
21世纪以来,人口数量急剧增长,城市化进程飞速发展,路网总量和机动车数量不断增长,交通拥堵状况越来越严重。准确合理地预估交通车速,实时评价交通状况,可以有效地疏导交通,显著改善交通拥堵状况,并且可以辅助管理者合理地实施交通管制,对保护人民生命财产,维护公共安全以及提升城市形象有着及其重要的意义。交通速度是一种时间序列数据,具有临近性和周期性的特点。前人对此已经做了相应的研究和探讨,目前,对交通速度预测的方法主要有传统的时间序列模型,如ARIMA。近几年,随着人工智能和数据挖掘等技术的发展,一些机器学习方法,如支持向量回归、神经网络模型等也被广泛地运用在交通预测中。其中,传统的时间序列模型,由于其是基于线性的,难以模拟道路的真实状况,且没有考虑数据的周期性。而神经网络等机器学习模型不但需要较长的训练时间,而且容易造成模型过拟合等问题,难以实现对实际交通速度实时预测。此外,现存的方法大多是对某一条道路单独建模,而忽略其他相关路段的影响。但实际上,由于城市交通网的存在,不同道路之间的车流量、车速等存在一定关系,即不同道路间会相互影响。基于单一道路的模型并不能很好地运用在实际的城市道路预测中,基于此,本专利技术考虑了相关路段的相互影响。此外,由于交通速度数据是一种时序性数据,本专利技术采用慢特征分析的方法有效提取交通速度数据中变化缓慢的特征。又由于天气和节假日等随机因素会对交通速度造成一定程度的影响,本专利技术引入了天气和节假日等随机因素。综上,本专利技术所提出的基于时空宽度学习的交通速度预测方法,既考虑了相关路段的影响,又有效提取了时序数据的慢特征,且融入了天气和节假日因素的影响。模型的训练上,采用了与宽度学习结构相似的模型,其训练时间短,拟合效果好。同时引入了L1和L2正则化来防止模型的过拟合。到目前为止,尚未见到与本专利技术相关的研究报道。
技术实现思路
本专利技术的目的在于针对现有交通速度预测方法的不足,提供一种基于时空宽度学习的交通速度预测方法。本专利技术的目的是通过以下技术方案来实现的:一种基于时空宽度学习的交通速度预测方法,该方法包括以下步骤:步骤1:建模数据预处理:对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理。对于速度数据,将获取的车辆速度数据按照不同路段分类,按时间先后顺序排序。对需要分析的每一个路段,选取第k时刻之后的1小时作为时间间隔,k表示该时间间隔的起点,用该时间间隔内该路段上速度的平均值来代替第k时刻的速度。k=0,1,2,…,23,即每个时间间隔的起点为整点,从而每个路段每天被分割成24个时刻(0点到23点),每一个时刻对应一个固定的速度值。则路段i在m天内获得的速度向量可以表示为viT(1×24m),其中,i为路段代号,i=1,2,…,L,L为路段总数。对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段i在m天内的天气数据表示为wiT(1×24m),日期类别数据表示为diT(1×24m)。步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关路段:(2.1)设c为待预测路段代号。删掉vcT的第一个样本和viT(i=1,2,…,L,i≠c)的最后一个样本后重新对齐,构成L个新的速度向量ViT(1×24m)。(2.2)对于L个新的速度向量ViT(1×24m),(i=1,2,…,L),用一个长度为K个样本的一维滑动窗口滑过viT(1×24m),每次向后滑动12个样本,那么一共可以滑动z次,其中z=(24m-K)/12。将路段i在第j个滑动窗口中的数据所组成的列向量记为则所有路段在第j个滑动窗口中的列向量组成一个矩阵窗口移动z次共得到z个矩阵,对于第j个矩阵,按照下式计算与其他L-1个列向量的相关系数其中,vnckj为路段c在第j个滑动窗口中的数据所组成的列向量中的第k个元素;为vnckj的均值,为vnikj的均值,那么,路段c与任意路段i的速度滑动相关程度系数定义为Rci,由下式得到:(2.3)然后依据Rci确定相关路段:将Rci按照降序排列,从中选取前F个最大值所对应的路段代号i,则相关路段确定完毕。表示在除路段c以外的路段中选取了F个与路段c相关的路段,其路段代号记为r1,r2,...,rF,这些相关路段的速度将作为变量用于预测模型的建立。步骤3:确定模型的输入变量对于路段代号为c的待预测路段,在第M~m天内,采用如下四部分的样本对第t时刻的交通速度vc(t)进行预测:第一部分为:路段c在t-24M,t-24(M-1),...,t-24时刻的速度;第二部分为:路段c在t-N,t-(N-1),...t-1时刻的速度;第三部分为:步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度vr1,vr2,...,vrF;第四部分为:路段c在t时刻的天气和时间类型wc(t),dc(t)。路段c在t-24M,t-24(M-1),...,t-24时刻的速度、路段c在t-N,t-(N-1),...t-1时刻的速度、步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度vr1,vr2,...,vrF、路段c在t时刻的天气和时间类型wc(t),dc(t)依次构成长度为M+N+F+2的预测变量。24(m-M)个预测变量和响应变量组成维度为24(m-M)×(M+N+F+2)的预测变量矩阵X'和维度为24(m-M)×1的响应变量矩阵Y。步骤4:提取速度变量的慢特征(4.1)取步骤3中所述预测变量矩阵X'的前M+N+F列,作为速度变量矩阵X'1,对于X'1的第i列X1i',进行如下式所示的减均值的中心化处理:X1i=X1i'-var(X1i')(12)其中,i=1,2,…,M+N+F,var(X1i')表示X1的第i列的均值。中心化处理后的X1i组成新的变量矩阵X1。(4.2)构造X1的协方差矩阵,并进行SVD分解,如下式所示:X1X1T=UΛUT(13)按下式进行白化处理:B=Λ-1/2UTX1=QX1(14)其中,B为白化后的矩阵,Q=Λ-1/2UT是白化矩阵。(4.3)对B的第二行开始的每一行减去前一行所得到的差分矩阵再进行SVD分解,求解得到正交矩阵P,Ω表示对角矩阵。则静态慢特征S1=PB=WX1,其中,W=PQ。(4.4)对S1进行行向量差分,从第2行开始,每行减去上一行得到新的矩阵,即得到动态慢特征S2。(4.5)去掉S1的第一行,与S2按行方向进行拼接,得到特征维度为2(M+N+F)的速度慢特征矩阵S。步骤5:建立基于时空宽度学习的交通速度预测模型;步骤6:在线预测;(6.1)对测试样本,首先执行步骤1到步骤3,得到测试样本的待预测变量矩阵Xt(p×(M+N+F+2))和响应变量矩阵Yt(p×1),p为测试样本个数。(6.2)取Xt的前M+N+F列为速度变量矩阵首先对的每一列进行与训练集相同的中心化处理。然后按下式提取静态慢特征:其中W为步骤(4.3)中获取的W。对求行向量差分,第1行减去训练集的最后一行,从第2行开始,本文档来自技高网
...

【技术保护点】
1.一种基于时空宽度学习的交通速度预测方法,其特征在于,该方法包括以下步骤:步骤1:建模数据预处理:对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理。步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关路段。步骤3:确定模型的输入变量;步骤4:提取速度变量的慢特征。步骤5:建立基于时空宽度学习的交通速度预测模型;步骤6:在线预测。

【技术特征摘要】
1.一种基于时空宽度学习的交通速度预测方法,其特征在于,该方法包括以下步骤:步骤1:建模数据预处理:对各路段的速度数据和对应时刻的天气类型、节假日类型进行预处理。步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关路段。步骤3:确定模型的输入变量;步骤4:提取速度变量的慢特征。步骤5:建立基于时空宽度学习的交通速度预测模型;步骤6:在线预测。2.根据权利要求1所述的方法,其特征在于,所述步骤1具体为:对于速度数据,将获取的车辆速度数据按照不同路段分类,按时间先后顺序排序。对需要分析的每一个路段,选取第k时刻之后的1小时作为时间间隔,k表示该时间间隔的起点,用该时间间隔内该路段上速度的平均值来代替第k时刻的速度。k=0,1,2,…,23,即每个时间间隔的起点为整点,从而每个路段每天被分割成24个时刻(0点到23点),每一个时刻对应一个固定的速度值。则路段i在m天内获得的速度向量可以表示为viT(1×24m),其中,i为路段代号,i=1,2,…,L,L为路段总数。对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段i在m天内的天气数据表示为wiT(1×24m),日期类别数据表示为diT(1×24m)。3.根据权利要求1所述的方法,其特征在于,所述步骤2具体为:步骤2:搜寻对预测路段的速度有影响的路段,并定义为待预测路段的相关路段:(2.1)设c为待预测路段代号。删掉vcT的第一个样本和viT(i=1,2,…,L,i≠c)的最后一个样本后重新对齐,构成L个新的速度向量ViT(1×24m)。对齐的目的是为了分析其他路段i上一时刻的速度对待预测路段c当前时刻的速度的影响。(2.2)对于L个新的速度向量ViT(1×24m),(i=1,2,…,L),用一个长度为K个样本的一维滑动窗口滑过viT(1×24m),每次向后滑动12个样本,那么一共可以滑动z次,其中z=(24m-K)/12。将路段i在第j个滑动窗口中的数据所组成的列向量记为则所有路段在第j个滑动窗口中的列向量组成一个矩阵窗口移动z次共得到z个矩阵,对于第j个矩阵,按照下式计算与其他L-1个列向量的相关系数其中,vnckj为路段c在第j个滑动窗口中的数据所组成的列向量中的第k个元素;为vnckj的均值,为vnikj的均值,那么,路段c与任意路段i的速度滑动相关程度系数定义为Rci,由下式得到:(2.3)然后依据Rci确定相关路段:将Rci按照降序排列,从中选取前F个最大值所对应的路段代号i,则相关路段确定完毕。表示在除路段c以外的路段中选取了F个与路段c相关的路段,其路段代号记为r1,r2,...,rF,这些相关路段的速度将作为变量用于预测模型的建立。4.根据权利要求1所述的方法,其特征在于,所述步骤3具体为:对于路段代号为c的待预测路段,在第M~m天内,采用如下四部分的样本对第t时刻的交通速度vc(t)进行预测:第一部分为:路段c在t-24M,t-24(M-1),...,t-24时刻的速度;第二部分为:路段c在t-N,t-(N-1),...t-1时刻的速度;第三部分为:步骤二所述的F个与路段c相关的路段在(t-1)时刻的速度vr1,vr2,...,vrF;第四部分为:路段c在t时...

【专利技术属性】
技术研发人员:赵春晖崔紫强
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1