一种基于三层K近邻的短时交通流预测方法技术

技术编号:12872530 阅读:69 留言:0更新日期:2016-02-17 10:24
本发明专利技术公开了一种基于三层K近邻的短时交通流预测方法。包括如下步骤:(1)基于固定时间间隔统计交通流量并建立历史样本数据库;(2)分别采用相似离度和相关系数评价当前点和历史数据库中点的形状相似度,并进行点的第一层筛选;(3)根据命中率及形似距离对第一层筛选出的点进行综合评价,并进行点的第二层筛选;(4)用欧氏距离法评价当前点和第二层筛选出的点的匹配距离,并采用各最近邻点平移到当前点后相应下一时刻交通流量的组合形状相似距离倒数的加权平均值输出预测结果。本发明专利技术采用了两层形状相似性匹配功能,考虑了最近邻点和当前点之间的形状匹配距离,提高了短时交通流预测的准确性与实时性。

【技术实现步骤摘要】
一种基于三层K近邻的短时交通流预测方法
本专利技术涉及一种短时交通流预测方法,更具体的说,尤其涉及一种基于三层K近邻的短时交通流预测方法。
技术介绍
随着社会经济的发展,城市规模不断扩大,城市交通问题越来越突出。智能交通系统被视为解决交通拥堵问题的一种重要手段。随着智能交通各个领域相关技术的进步,无论是交通出行者或是交通管理者都迫切想要实时动态地获取道路上的交通运行状态,实时动态交通分配已成为智能交通系统的关键技术。实时动态交通分配需要在做出控制变量决策的时刻t对下一决策时刻t+1乃至以后若干时刻的交通流量做出预测,一般认为t到t+1之间的预测时间跨度不超过15分钟(甚至小于5分钟)的预测是短时交通流预测。目前短时交通流预测模型中,主要是基于参数回归的方法,有历史平均模型、时间序列模型、卡尔曼滤波模型、小波理论模型、神经网络模型等。相对于参数回归,非参数回归是另一类预测方法,它并不对数据作任何严格的限定,只需借助足够的历史数据来描述系统,并仅依赖于已有数据来决定输入和输出的关系,当有新数据产生时不需要对参数做耗时的调整。K近邻非参数回归是公路短时交通流预测的可靠方法之一,它能够很好地体现交通流的非线性、时变性和不确定性。但是道路交通系统是一个有时变的、复杂的非线性系统,它的显著特点之一就是具有高度的不确定性,致使单一K近邻非参数回归预测模型对复杂的交通流量预测稳定性不高。一些组合的短时交通流预测方法往往算法复杂、计算量较大,不能同时兼顾预测的准确性与实时性。
技术实现思路
本专利技术为了克服上述技术问题的缺点,提供了一种的基于三层K近邻的短时交通流预测方法。本专利技术的基于三层K近邻的短时交通流预测方法,通过以下步骤来实现:a).建立历史样本数据库,根据待预测路段的历史交通流量,建立待预测路段的m个历史交通流量状态向量Vh1、Vh2、…、Vhm,形成历史样本数据库,其中历史交通流量状态向量如公式(1)所示:式中,1≤i≤m,m为历史交通流量状态向量的数目,分别为历史交通流量状态向量Vhi中t时刻的交通流量,表示历史交通流量状态向量的维数;b).采集当前交通流量状态向量,基于固定时间间隔统计待预测路段的当前交通流量状态向量V(t),V(t)的表达式如公式(2)所示:式中,V(t)为待预测路段t时刻的交通流量状态向量,分别为交通流量状态向量V(t)中时刻的交通流量,表示当前交通流量状态向量的维数;c).利用相似度进行筛选,通过步骤c-1)至c-2)来实现:c-1).求交通流量的平均差值,根据公式(3)求取当前交通流量状态向量V(t)与历史交通流量状态向量Vhj所有对应向量分量的平均差值Ej:式中,1≤j≤m,为交通流量状态向量的维数,m为历史样本数据库中历史交通流量状态向量的数目;dji为当前交通流量状态向量V(t)中的第个向量分量与历史交通流量状态向量Vhj中的第个向量分量的差值,其通过公式(4)进行求取:dji=v(t-i+1)-vhj(t-i+1)(4)式中,1≤j≤m;c-2).求取相似离度,将历史数据库中所有的历史交通流量状态向量均通过步骤c-1)进行处理,然后根据公式(5)求取当前交通流量状态向量V(t)与每一个历史交通流量状态向量Vhj的相似离度Rj:式中,1≤j≤m;所有的历史交通流量状态向量均进行步骤(5)的处理后,即可获取m个相似离度R1、R2、…、Rm,按照相似离度从小到大进行排序,选出相似离度最小即距离最近的前n个,其对应的历史交通流量状态向量构成集合A,集合A中的元素分别记为Vh(t1)、Vh(t2)、…、Vh(tn),即:A={Vh(t1),Vh(t2),...,Vh(tn)}即得到筛选后的集合A;d).利用相关系数进行筛选,通过步骤d-1)至d-2)来实现:d-1).求取相关系数,通过公式(6)求取当前交通流量状态向量V(t)与历史交通流量状态向量Vhj的相关系数R′j,以通过相关系数来评价两状态向量的形状相似度:其中,为当前交通流量状态向量V(t)中所有向量的平均值,其通过公式(7)进行求取:为历史交通流量状态Vhi中所有向量的平均值,其通过公式(8)进行求取:公式(6)、(7)和(8)中,1≤j≤m;d-2).求取筛选后的集合A′,经过步骤d-1)的处理后,可获取m个历史交通流量状态向量与当前交通流量状态向量的相关系数R′1、R′2、…、R′m,将m个相关系数从大到小排序,选出相关系数最大的前n个,其对应的历史交通流量状态向量构成集合A′,集合A′中的元素分别记为Vh(t′1)、Vh(t′2)、…、Vh(t′n),即:A′={Vh(t′1),Vh(t′2),...,Vh(t′n)}即得到筛选后的集合A′;获取了集合A和A′后即完成了第一层的匹配与筛选;e).第二层的匹配与筛选,将属于集合A与A′的交集以及仅属于集合A或A′的历史交通流量状态共计n个,归入集合B中,形成第二层匹配与筛选后的集合B;f).获取下一时段的交通流量预测结果,首先利用欧氏距离来评价当前交通流量状态向量和集合B的点的相似度,采用基于组合形状相似距离倒数的加权平均法和最相似点距离调整法来构造预测函数,得到下一时段的交通流量预测结果。本专利技术的基于三层K近邻的短时交通流预测方法,步骤e)中所述的第二层的匹配与筛选,通过以下步骤来实现:e-1).令i=1,集合C=φ,集合D=φ,B=φ;e-2).对于集合A中的历史交通流量状态向量Vh(ti),若Vh(ti)∈A′,则Vh(ti)∈C;e-3).i依次取1,2,...,n,执行步骤e-2),获取最终的集合C;e-4).令j=1,q=n-card(C),函数card(C)返回集合C中元素的数目;e-5).对于集合A中的历史交通流量状态向量Vh(tj),若则Vh(tj)∈D;对于集合A′中的历史交通流量状态向量Vh(t′j),若则Vh(t′j)∈D;e-6).j依次取1,2,...,n,执行步骤e-5),直至card(D)=q结束,获取最终的集合D;e-7).取集合C与集合D的并集,得到经过第二层匹配与筛选后的集合B,B=C∪D。本专利技术的基于三层K近邻的短时交通流预测方法,步骤f)中所述的获取下一时段的交通流量预测结果,通过以下步骤来实现:f-1).求与集合B中元素的欧式距离,通过公式(9)求取当前交通流量状态向量V(t)与集合B中历史交通流量状态向量Vhj的欧式距离dhj:式中,1≤j≤集合B中元素的数目,为交通流量状态向量的维数;f-2).选取距离最近的k个点,对当前交通流量状态向量与集合B中历史交通流量状态向量的欧式距离由小到大进行排序,选取距离最近的k个点,这k个点就形成了第三层匹配与筛选后的集合,设该集合为F;f-3).预测下一时段的交通流量,采用如公式(10)所示的基于相似离度和相关系数的加权平均法和最相似点距离调整法来构造预测函数其中,为下一时段交通流量的预测值,k为集合F中元素的个数;R′、R分别为相关系数、相似离度;bj为当前交通流量状态向量与集合F中某个历史交通流量状态向量中向量分量的总平均差值,为交通流量状态向量的维数。本专利技术的基于三层K近邻的短时交通流预测方法,所述的交通流量状态向量的维数满足:集合A和集合A′中所选取的历史交通流量状态向量的本文档来自技高网...
一种基于三层K近邻的短时交通流预测方法

【技术保护点】
一种基于三层K近邻的短时交通流预测方法,其特征在于,通过以下步骤来实现:a).建立历史样本数据库,根据待预测路段的历史交通流量,建立待预测路段的m个历史交通流量状态向量Vh1、Vh2、…、Vhm,形成历史样本数据库,其中历史交通流量状态向量如公式(1)所示:Vhi=[vhi(t‑l+1),vhi(t‑l+2),…,vhi(t)]    (1)式中,1≤i≤m,m为历史交通流量状态向量的数目,vhi(t‑l+1)、vhi(t‑l+2)、…、vhi(t)分别为历史交通流量状态向量Vhi中t‑l+1、t‑l+2、...、t时刻的交通流量,l表示历史交通流量状态向量的维数;b).采集当前交通流量状态向量,基于固定时间间隔统计待预测路段的当前交通流量状态向量V(t),V(t)的表达式如公式(2)所示:V(t)=[v(t‑l+1),v(t‑l+2),…,v(t)]    (1)式中,V(t)为待预测路段t时刻的交通流量状态向量,v(t‑l+1)、v(t‑l+2)、…、v(t)分别为交通流量状态向量V(t)中t‑l+1、t‑l+2、...、t时刻的交通流量,l表示当前交通流量状态向量的维数;c).利用相似度进行筛选,通过步骤c‑1)至c‑2)来实现:c‑1).求交通流量的平均差值,根据公式(3)求取当前交通流量状态向量V(t)与历史交通流量状态向量Vhj所有对应向量分量的平均差值Ej:Ej=1lΣi=1ldji---(3)]]>式中,1≤i≤l,1≤j≤m,l为交通流量状态向量的维数,m为历史样本数据库中历史交通流量状态向量的数目;dji为当前交通流量状态向量V(t)中的第l+1‑i个向量分量与历史交通流量状态向量Vhj中的第l+1‑i个向量分量的差值,其通过公式(4)进行求取:dji=v(t‑i+1)‑vhj(t‑i+1)    (4)式中,1≤i≤l,1≤j≤m;c‑2).求取相似离度,将历史数据库中所有的历史交通流量状态向量均通过步骤c‑1)进行处理,然后根据公式(5)求取当前交通流量状态向量V(t)与每一个历史交通流量状态向量Vhj的相似离度Rj:Rj=1lΣi=1l|dji-Ej|---(5)]]>式中,1≤i≤l,1≤j≤m;所有的历史交通流量状态向量均进行步骤(5)的处理后,即可获取m个相似离度R1、R2、…、Rm,按照相似离度从小到大进行排序,选出相似离度最小即距离最近的前n个,其对应的历史交通流量状态向量构成集合A,集合A中的元素分别记为Vh(t1)、Vh(t2)、…、Vh(tn),即:A={Vh(t1),Vh(t2),...,Vh(tn)}即得到筛选后的集合A;d).利用相关系数进行筛选,通过步骤d‑1)至d‑2)来实现:d‑1).求取相关系数,通过公式(6)求取当前交通流量状态向量V(t)与历史交通流量状态向量Vhj的相关系数R′j,以通过相关系数来评价两状态向量的形状相似度:Rj′=Σi=1l(v(t-i+1)-v(t)‾)(vhj(t-i+1)-vhj(t)‾)Σi=1l(v(t-i+1)-v(t)‾)2·Σi=1l(vhj(t-i+1)-vhj(t)‾)2---(6)]]>其中,为当前交通流量状态向量V(t)中所有向量的平均值,其通过公式(7)进行求取:v(t)‾=1lΣi=1lv(t-i+1)---(7)]]>为历史交通流量状态Vhi中所有向量的平均值,其通过公式(8)进行求取:vhj(t)‾=1lΣi=1lvh(t-i+1)---(8)]]>公式(6)、(7)和(8)中,1≤i≤l,1≤j≤m;d‑2).求取筛选后的集合A′,经过步骤d‑1)的处理后,可获取m个历史交通流量状态向量与当前交通流量状态向量的相关系数R′1、R′2、…、R′m,将m个相关系数从大到小排序,选出相关系数最大的前n个,其对应的历史交通流量状态向量构成集合A′,集合A′中的元素分别记为Vh(t′1)、Vh(t′2)、…、Vh(t′n),即:A′={Vh(t′1),Vh(t′2),...,Vh(t′n)}即得到筛选后的集合A′;获取了集合A和A′后即完成了第一层的匹配与筛选;e).第二层的匹配与筛选,将属于集合A或属于集合A′但不属于集合A与集合A′交集的历史交通流量状态向量归入集合B中,形成第二层匹配与筛选后的集合B;f).获取下一时段的交通流量预测结果,首先利用欧氏距离来评价当前交通流量状态向量和集合B的点的相似度,采用基于组合形状相似距离倒数的加权平均法和最相似点距离调整法来构造预测函数,得到下一时段的交通流量预测结果。...

【技术特征摘要】
1.一种基于三层K近邻的短时交通流预测方法,其特征在于,通过以下步骤来实现:a).建立历史样本数据库,根据待预测路段的历史交通流量,建立待预测路段的m个历史交通流量状态向量Vh1、Vh2、…、Vhm,形成历史样本数据库,其中历史交通流量状态向量如公式(1)所示:式中,1≤i≤m,m为历史交通流量状态向量的数目,分别为历史交通流量状态向量Vhi中t时刻的交通流量,表示历史交通流量状态向量的维数;b).采集当前交通流量状态向量,基于固定时间间隔统计待预测路段的当前交通流量状态向量V(t),V(t)的表达式如公式(2)所示:式中,V(t)为待预测路段t时刻的交通流量状态向量,分别为交通流量状态向量V(t)中t时刻的交通流量,表示当前交通流量状态向量的维数;c).利用相似度进行筛选,通过步骤c-1)至c-2)来实现:c-1).求交通流量的平均差值,根据公式(3)求取当前交通流量状态向量V(t)与历史交通流量状态向量Vhj所有对应向量分量的平均差值Ej:式中,1≤j≤m,为交通流量状态向量的维数,m为历史样本数据库中历史交通流量状态向量的数目;dji为当前交通流量状态向量V(t)中的第个向量分量与历史交通流量状态向量Vhj中的第个向量分量的差值,其通过公式(4)进行求取:dji=v(t-i+1)-vhj(t-i+1)(4)式中,1≤j≤m;c-2).求取相似离度,将历史数据库中所有的历史交通流量状态向量均通过步骤c-1)进行处理,然后根据公式(5)求取当前交通流量状态向量V(t)与每一个历史交通流量状态向量Vhj的相似离度Rj:式中,1≤j≤m;所有的历史交通流量状态向量均进行步骤(5)的处理后,即可获取m个相似离度R1、R2、…、Rm,按照相似离度从小到大进行排序,选出相似离度最小即距离最近的前n个,其对应的历史交通流量状态向量构成集合A,集合A中的元素分别记为Vh(t1)、Vh(t2)、…、Vh(tn),即:A={Vh(t1),Vh(t2),...,Vh(tn)}即得到筛选后的集合A;d).利用相关系数进行筛选,通过步骤d-1)至d-2)来实现:d-1).求取相关系数,通过公式(6)求取当前交通流量状态向量V(t)与历史交通流量状态向量Vhj的相关系数R′j,以通过相关系数来评价两状态向量的形状相似度:其中,为当前交通流量状态向量V(t)中所有向量的平均值,其通过公式(7)进行求取:为历史交通流量状态Vhi中所有向量的平均值,其通过公式(8)进行求取:公式(6)、(7...

【专利技术属性】
技术研发人员:朱勇黄国林殷立峰庞希愚汪庆明张德亮崔龙波何镇镇李学岭吴茂呈奚钟华王成
申请(专利权)人:山东易构软件技术股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1