一种交通状态预测集成方法技术

技术编号:37417176 阅读:15 留言:0更新日期:2023-04-30 09:40
本发明专利技术公开了一种交通状态预测集成方法,属于公共交通客流检测技术领域。本发明专利技术构建鲁棒的且最大化各组件之间多样性的集成模型,将每个训练数据子集输入相应的子模型进行训练;通过设计的迭代算法更新每个子模型,当迭代结束后,生成最优的预测模型,把待预测数据集输入至生成的子模型,从而获得每个子模型的预测结果,在此基础上给出最终的预测值。通过本发明专利技术可有效地提高复杂场景(如天气情况、交通拥堵或交通事故等)下的短时交通状态预测精度。堵或交通事故等)下的短时交通状态预测精度。堵或交通事故等)下的短时交通状态预测精度。

【技术实现步骤摘要】
一种交通状态预测集成方法


[0001]本专利技术涉及交通状态预测领域,具体涉及一种具有鲁棒性和最大化多样性的交通状态预测集成方法。

技术介绍

[0002]在社会经济快速发展的情况下,汽车保有量的急剧增长将导致潜在的交通拥堵、交通事故、严重的环境和噪声污染等问题,其中交通拥堵导致经济损失、出行时间耗费并加剧环境污染;交通事故严重影响社会经济的发展和人民生活的提高,这给社会的可持续发展带来障碍。交通状态预测旨在探究未来时刻的交通运行状态,使城市道路高效的运行,为交通参与者提供高品质的交通服务。基于交通状态预测方法被认为是缓解交通拥堵、预防交通事故、减少排放和燃料消耗的有效途径。因此,近几十年来,该领域的研究者已提出多种类型的短时交通状态预测方法,包括:基于SVM及其改进模型的短时交通状态预测方法、基于集成学习的短时交通状态预测方法、基于深度学习的短时交通状态预测方法等。
[0003]集成学习通过组合多个表现较好的算法以期望得到一个更好、更全面的预测模型,其中心思想是即便某一个模型得到错误的预测,其他的模型也可以将错误纠正回来。鉴于集成学习较好的预测能力,其被广泛地应用于交通流预测中。大量的实验结果表明,基于集成学习的预测方法具有准确率高、泛化能力强等优势。
[0004]但是,由于各种不可控因素(如雨雪天气情况、交通拥堵、交通事故、传输失真、传感器通讯故障等),采集的数据中不可避免的含有不正常的数据点(简称异常值)、错误或缺失的数据,这显著地影响了模型的预测精度。尽管可以使用某些预处理方法(如丢弃,填充,替换,重复数据删除等)从样本数据中删除异常值,但不能保证将这些不正常的数据点完全删除。另外,这些异常值可能是模型预测的重要特征,如交通拥堵或交通事故下的交通数据更能反映道路运行的真实情况。因此,提高集成模型的鲁棒性是一项重要且有意义的研究工作。

技术实现思路

[0005]针对现有技术存在的缺点与不足,本专利技术的目的在于提供一种具有鲁棒性和最大化多样性的交通状态预测集成方法,本方法可保证即使在外部因素的影响下也可获得较高的预测精度,为交通信息的发布和避免城市道路潜在的交通拥堵提供基础。
[0006]本专利技术公开的交通状态预测集成方法,其技术方案包括以下步骤:从不同的交通数据采样点获取交通采样数据,作为待预测数据,其中待预测数据根据相应的交通数据采样点位置划分为相应的多个数据子集;将待预测数据的输入到训练好的鲁棒的且最大化各组件之间多样性的集成模型中,其中所述集成模型根据相应的交通数据采样点位置也划分为相应的多个子模型,待预测数据的每个数据子集分别输入到相应的子模型中得到每个子模型的预测结果,并综合每个子模型的预测结果给出最终的预测值;
所述各个子模型的目标函数表示如下:
[0007]其中,p∈(0,2],||
·
||2表示L2范数距离,m代表各子模型数据样本类型序号,C为各子模型数据样本类型总数,c
m
是各子模型第m类样本对应的最优参数、通过优化算法预先得到,e
1m
和e
2m
分别是矩阵A
m
和B
m
相应维度的单位列向量,矩阵A
m
表示各子模型第m类样本组成的数据集合,矩阵B
m
表示各子模型除第m类样本外的其余的m

1类样本组成的数据集合,矩阵A
m
和B
m
具有相同维度数n,q
m
是各子模型第m类样本对应的松弛变量、通过上述目标函数的约束条件获得,λ1是预设的平衡集成模型的预测误差和多样性的参数,F(w)表示多样性函数,w
m
表示各子模型第m类样本的权向量,b
m
表示各子模型第m类样本的偏差,w=[w1,w2,

,w
L
]T
为多样性加权向量,L为子模型的总数,w
m
、b
m
、F(w)和p通过迭代优化获得最优值;在上述目标函数中,第一、二项属于集成模型的预测误差,第三项代表多样性,当完成优化时两者实现最优。
[0008]进一步而言,所述c
m
通过果蝇优化算法获得。
[0009]进一步而言,通过迭代优化获得得w
m
、b
m
、F(w) 和p的最优值,是通过迭代更新每个子模型的增广向量,当迭代结束后,得到最优值,具体步骤为:1)设置迭代次数t和迭代步长p的初始值分别为1和0.1,初始化增广向量z
m1
以及对角矩阵D
1m1
和D
2m1
,其中D
1m1
的第i个对角元素和D
2m1
的第j个对角元素分别为:
[0010]a
i
代表矩阵A
m
中第i行数据,b
j
代表矩阵B
m
中第j行数据,m1表示矩阵A
m
的总行数,m2表示矩阵B
m
的总行数,e
1mi
代表e
1m
中第i行数据,e
2mj
代表e
2m
中第j行数据;初始化多样性加权向量w;2)计算增广向量z
m(t+1)
,并根据增广向量z
m(t+1)
更新对角矩阵D
1m(t+1)
和D
2m(t+1)
,具体为:
[0011]其中,ε为正则化系数,I为单位矩阵;3)当获得增广向量z
m(t+1)
时,使用交替方向乘子法确定多样性函数F(w),具体为:
[0012]其中,L
k
和L
l
分别表示第k个和l个子模型,p
k
表示L
k
的预测向量,p
l
表示L
l
的预测向量;矩阵D
t
的第k行第l列为
[0013]通过F(w)的拉格朗日函数,计算获得多样性加权向量的下一次迭代值w
(t+1)
:w
(t+1) =(α
t
e

β
t
)/( λ1D
t
)其中,α
t
和β
t
代表迭代次数为t时F(w)非负的拉格朗日乘子,e是相应维度的单位列向量;4)根据步骤2)所得到增广向量z
m(t+1)
获得权向量w
m
和偏差b
m
,结合步骤3)获得的多样性函数F(w)和迭代步长p,根据子模型目标函数,计算本次迭代的子模型目标函数值;如果迭代次数t等于1,则更新迭代次数t=t+1及p=p+0.1,返回步骤2)继续迭代;如果迭代次数t大于1,则比较本次迭代的子模型目标函数值与前次迭代的子模型目标函数值,如两者差值小于预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种交通状态预测集成方法,其特征在于,包括以下步骤:从不同的交通数据采样点获取交通采样数据,作为待预测数据,其中待预测数据根据相应的交通数据采样点位置划分为相应的多个数据子集;将待预测数据的输入到训练好的鲁棒的且最大化各组件之间多样性的集成模型中,其中所述集成模型根据相应的交通数据采样点位置也划分为相应的多个子模型,待预测数据的每个数据子集分别输入到相应的子模型中得到每个子模型的预测结果,并综合每个子模型的预测结果给出最终的预测值;所述各个子模型的目标函数表示如下:其中,p∈(0,2],||
·
||2表示L2范数距离,m代表各子模型数据样本类型序号,C为各子模型数据样本类型总数,c
m
是各子模型第m类样本对应的最优参数、通过优化算法预先得到,e
1m
和e
2m
分别是矩阵A
m
和B
m
相应维度的单位列向量,矩阵A
m
表示各子模型第m类样本组成的数据集合,矩阵B
m
表示各子模型除第m类样本外的其余的m

1类样本组成的数据集合,矩阵A
m
和B
m
具有相同维度数n,q
m
是各子模型第m类样本对应的松弛变量、通过上述目标函数的约束条件获得,λ1是预设的平衡集成模型的预测误差和多样性的参数,F(w)表示多样性函数,w
m
表示各子模型第m类样本的权向量,b
m
表示各子模型第m类样本的偏差,w=[w1,w2,

,w
L
]
T
为多样性加权向量,L为子模型的总数,w
m
、b
m
、F(w)和p通过迭代优化获得最优值;在上述目标函数中,第一、二项属于集成模型的预测误差,第三项代表多样性,当完成优化时两者实现最优。2.如权利要求1所述的交通状态预测集成方法,其特征在于,所述c
m
通过果蝇优化算法获得。3.如权利要求1所述的交通状态预测集成方法,其特征在于,通过迭代优化获得w
m
、b
m
、F(w) 和p的最优值,是通过迭代更新每个子模型的增广向量,当迭代结束后,得到最优值,具体步骤为:1)设置迭代次数t和迭代步长p的初始值分别为1和0.1,初始化增广向量z
m1
以及对角矩阵D
1m1
和D
2m1
,其中D
1m1
的第i个对角元素和D
2m1
的第j个对角元素分别为:a
i
代表矩阵A
m
中第i行数据,b
j
代表矩阵B
m
中第j行数据,m1表示矩阵A
m
的总行数,m2表示矩阵B
m
的总行数,e
1mi
代表e

【专利技术属性】
技术研发人员:戚湧闫贺
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1