一种基于时空依赖的预测修正算法制造技术

技术编号:27939522 阅读:19 留言:0更新日期:2021-04-02 14:20
本发明专利技术公开了一种基于时间依赖的预测修正算法,本算法针对现有研究没有充分挖掘交通流时空依赖的问题,引入两层筛选结构,进一步分析了预测节点与周边空间节点的时空关系。为了细化相关性分析的粒度,本算法首先对节点相似性度量函数进行优化,并结合双重过滤准则选出空间依赖节点。然后利用空间依赖节点动态生成时空片段,并通过距离度量函数选择最相关的时空依赖片段。最后对前期预测结果和时空依赖片段对应的预测值建立多输入回归模型,从而到达预测修正的目的。本算法相对于其他基于时空依赖的算法而言,在预测精度上有一定的优势。

【技术实现步骤摘要】
一种基于时空依赖的预测修正算法一、
本专利技术涉及智能交通领域,尤其涉及短时交通流预测,具体是一种基于时空依赖的预测修正算法。二、
技术介绍
一个有效的交通流预测模型对于路线规划、交通控制和智能驾驶等方面十分重要。交通流数据不仅具有时间规律性,还具有空间依赖性。和普通时间序列数据不同,交通流数据往往还会受到其所在交通网络的影响,所以只对预测节点建立一维的时变模型是片面的。时空依赖的引入将交通流预测研究上升到了二维的时空矩阵层面,如何挖掘交通流数据中的时空依赖并加以利用是研究的关键问题。为了进一步分析和利用空间节点之间的依赖关系,可以将现有的时空依赖分析方法归纳为两个类别:基于地理因素的方法和基于相关性分析的方法。基于地理因素的方法又称为状态空间方法,该方法的理论依据是地理学第一定律,在交通流预测研究中表现为空间中每一个节点都与另一个节点息息相关,但是距离更近的节点之间的依赖关系更强。一些研究利用预测节点的上游节点或下游节点中的交通流数据建立时空依赖,大量研究结果显示引入时空依赖的预测模型具有更好的预测效果。还有一些研究根据两个空间节点的远近关系分配不同的权重系数,从而表示空间节点之间的依赖程度,这种方式能够在更大的周边范围内寻找时空依赖。相关研究指出模型中利用的空间节点的数量越多,预测精度越高。这说明交通网络中的所有节点对预测结果都有贡献,仅根据空间距离决定依赖关系的方式是片面的。基于相关性分析的方法与基于地理因素的方法不同,该方法的参考依据不是空间上的远近程度,而是数据之间的相关程度,因此在空间范围上没有限制。当两个空间节点的交通流数据表现出一致的变化趋势时,就认为这两个空间节点是相互依赖的。两个较远的空间节点之间也可能由于相似的交通环境而产生较强的依赖关系,所以扩大空间节点的搜索范围是合理的。另外,距离相近的空间节点之间既可能存在相似关系,也可能存在竞争关系,即相近的空间节点并不总是表现出一致的特征。因此,空间距离并不是决定依赖关系的唯一因素,对空间节点进行数据层面的相关性分析是很有必要的。已经有研究通过相关性分析的方法将交通网络中的时空依赖加入到预测模型之中,并取得了较好的预测效果,但这些研究在分析方法和分析程度上仍有可以提升的空间:在分析方法上,相关研究人员选择使用Pearson相关系数进行相关性分析,然而Pearson相关系数必须服从正态分布的假设,且只能描述两个变量之间的线性关系。当Pearson相关系数为0时,并不能保证两个变量是相互独立的;当Pearson相关系数接近1时,才能说明两个变量之间线性关系紧密。Pearson相关系数可用于对依赖关系较弱的空间节点进行过滤,其鲁棒性和准确性都有待提高。在分析程度上,相关研究人员使用空间依赖节点最近时刻的交通流数据构建时空依赖,对依赖关系的挖掘还不够充分。对于一维时变模型而言,在时间上越靠近预测点的观测值与预测结果的相关程度越高;但对于二维时空模型而言,节点之间的空间距离会造成时间差,所以相关空间节点中距离预测点更近的观测值与预测结果之间并不一定具有更强的依赖关系。三、
技术实现思路
本专利技术的目的是进一步挖掘交通流数据中的时空依赖,从而获得更高的交通流预测精度,通过引入两层筛选结构和细化分析粒度,从而进一步挖掘交通流数据中的时空依赖。本专利技术的目的是这样达到的:针对现有研究没有充分挖掘交通流时空依赖的问题,本专利技术引入两层筛选结构,首先对节点相似性度量函数进行优化,并结合双重过滤准则选出最相关的空间依赖节点;然后利用空间依赖节点动态生成相应的时空片段,并通过距离度量函数选择最相关的时空依赖片段,以此达到细化相关性分析粒度的目的。最后对前期预测结果和时空依赖片段对应的预测值建立多输入回归模型,从而达到预测修正的目的。具体做法是:为了研究空间节点之间的时空依赖关系,本专利技术在一块较复杂的交通区域内选取了24个空间节点作为研究对象。考虑到Pearson相关系数只能描述两个变量之间的线性关系,本专利技术在两层筛选结构的第一层中选择距离相关系数(DistanceCorrelation,DC)作为度量。DC系数的优点在于其不仅可以描述变量间的线性关系,还能描述变量间的非线性关系,且不需要任何的模型假设和参数条件。DC系数的构造过程如下:首先需要对变量X构建i行j列的距离矩阵Xij,Xij中的每一项记做xij,表示如下:Xij∶xij=‖xi-xj‖式中:Xij是变量X的距离矩阵;xij是变量X中的第i个元素和第j个元素之间的欧式距离。然后对距离矩阵中的每一项xij减去距离矩阵的行平均值和列平均值再加上整个距离矩阵的总平均值,得到变量X的双中心矩阵表示如下:式中:是变量X的双中心矩阵;xij是变量X中的第i个元素和第j个元素之间的欧式距离;是距离矩阵的行平均值;是距离矩阵的列平均值;n是距离矩阵中元素的总个数。同理可以求得Yij和利用和求得变量X和Y的距离协方差的平方,表示如下:式中:Cov(X,Y)是变量X和Y的距离协方差;和分别是变量X和Y的双中心矩阵;n是距离矩阵中元素的总个数。最后利用变量X和Y的距离协方差以及各自的距离方差求得DC系数,表示如下:式中:Cov(X,Y)是变量X和Y的距离协方差;Cov(X,X)和Cov(Y,Y)分别是变量X和Y的距离方差。另外,本专利技术在引入DC系数的基础上提出了双重过滤准则,第一是选中的空间节点必须与预测节点高度相关,第二是所选的空间节点应该与之前已经选中的空间节点在相关性上达到最小。这样既保证了相关空间节点的有效性,又降低了空间节点之间的冗余性,通过DC系数和双重过滤准则可以得到增强的距离相关系数(enhancedDistanceCorrelation,eDC),具体形式如下:式中:DC是两个空间节点之间的距离相关系数;Np是预测节点;Ni是新选择的空间节点;Nj是已选中的空间依赖节点;n是已选中的空间依赖节点的个数。为了在时间维度上对时空依赖进行更加深入的挖掘,本专利技术对选中的相关空间节点(简称空间依赖节点)建立时空矩阵,并在每次预测的过程中动态地将时空矩阵分割成不同的时空片段。然后通过距离度量函数选出最相关的时空片段(简称时空依赖片段),由此将分析对象由空间节点进一步细化为时空片段。最后建立多输入回归模型,利用时空依赖片段对应的预测值对前期预测结果进行修正,从而达到细化分析粒度的目的,具体过程如下:在第二层中将利用空间依赖节点建立时空矩阵,并对时空矩阵进行分割以得到时空片段,时空矩阵的具体形式如下:式中:STmatrix是时空矩阵;是第m个空间依赖节点在t-n时刻的交通流观测值。首先对矩阵中的每一行以时延d为大小进行分割,时延d根据应用场景的不同而不同。当空间依赖节点分布较近时,交通状态传播的速度较快,时延d的取值较小;当空间依赖节点分布较远时,时延d的取值可以适当增加。对时空矩阵中第i行的分割结果如下:...

【技术保护点】
1.一种基于时空依赖的预测修正算法,其特征在于:/n通过对节点相似性度量函数进行优化,并结合双重过滤准则选出最相关的空间依赖节点;然后利用空间依赖节点动态生成相应的时空片段,并通过距离度量函数选择最相关的时空依赖片段,这样可以细化相关性分析的粒度;最后对前期预测结果和时空依赖片段对应的预测值建立多输入回归模型,从而到达预测修正的目的:/n具体做法是:/n第一步,空间节点相似性度量过程;在两层筛选结构中,首先需要在第一层中筛选出与预测节点最相关的空间依赖节点,本算法采用DC系数和双重过滤准则确定两个空间节点之间依赖程度;/n第二步,时空片段距离度量过程;在两层筛选结构的第一层中已经完成了对空间依赖节点的筛选,在第二层中将利用空间依赖节点建立时空矩阵,并对时空矩阵进行分割以得到时空片段,最后通过距离度量函数确定最终的时空依赖片段;/n第三步,多输入回归模型建立过程;本算法的目的是利用时空依赖对预测模型的前期预测结果进行修正,为了将时空依赖嵌入到预测模型之中,需要建立多输入回归模型。/n

【技术特征摘要】
1.一种基于时空依赖的预测修正算法,其特征在于:
通过对节点相似性度量函数进行优化,并结合双重过滤准则选出最相关的空间依赖节点;然后利用空间依赖节点动态生成相应的时空片段,并通过距离度量函数选择最相关的时空依赖片段,这样可以细化相关性分析的粒度;最后对前期预测结果和时空依赖片段对应的预测值建立多输入回归模型,从而到达预测修正的目的:
具体做法是:
第一步,空间节点相似性度量过程;在两层筛选结构中,首先需要在第一层中筛选出与预测节点最相关的空间依赖节点,本算法采用DC系数和双重过滤准则确定两个空间节点之间依赖程度;
第二步,时空片段距离度量过程;在两层筛选结构的第一层中已经完成了对空间依赖节点的筛选,在第二层中将利用空间依赖节点建立时空矩阵,并对时空矩阵进行分割以得到时空片段,最后通过距离度量函数确定最终的时空依赖片段;
第三步,多输入回归模型建立过程;本算法的目的是利用时空依赖对预测模型的前期预测结果进行修正,为了将时空依赖嵌入到预测模型之中,需要建立多输入回归模型。


2.如权利要求1所述的空间节点相似性度量过程,其特征在于:使用DC系数对相关性分析方法进行优化,并引入了双重过滤准则:
相关性分析方法用于衡量两个变量之间的相似性,两个变量之间越相似,则其中一个变量中关于另一个变量的信息就越多,相较于Pearson相关系数而言,DC系数不需要任何的模型假设和参数条件,其通过对变量构造距离矩阵的方式,既可以刻画变量之间的线性关系,又可以刻画变量之间的非线性关系;当两个变量之间的DC系数为0时,说明这两个变量是相互独立的;DC系数在环境科...

【专利技术属性】
技术研发人员:陈彦如张媛媛林罗杰王浩胡顺仿刘畅魏亮雄王伟张磊梁刚许春陈良银
申请(专利权)人:成都易书桥科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1