交通拥堵预判系统及方法技术方案

技术编号:34880311 阅读:19 留言:0更新日期:2022-09-10 13:36
本发明专利技术公开了一种交通拥堵预判系统及方法,系统包括:数据处理模块,用于读取交通流数据、数据清洗、数据编码,筛选变量特征,变量特征分为训练样本集、验证样本集;模型构建训练模块,用于构建代价敏感神经网络模型,变量特征为输入,定义加权交叉熵损失函数为每批次样本数量的第i个样本数据第k维的真实样本标签与神经网络输出的乘积求总和后平均的值再与权重的乘积,k为类别数;样本真实标签为顺畅状态时的权重等于顺畅权重,顺畅权重为每批拥堵样本数与真实标签每批样本总数的比;样本真实标签为拥堵状态时的权重等于拥堵权重,拥堵权重为每批顺畅样本数与真实标签每批样本总数的比,预测评估模块,用于输出交通流处于拥堵状态的概率。状态的概率。状态的概率。

【技术实现步骤摘要】
交通拥堵预判系统及方法


[0001]本专利技术涉及智能交通
,特别涉及一种交通拥堵预判系统及方法。

技术介绍

[0002]随着信息技术在道路交通管理中应用范围的扩大和应用程度的深化,先进的交通管理系统(Advance Traffic Management System,ATMS)受到了广泛的关注,而交通状态判别是交通运行管理的重要组成部分,是交通运输控制和诱导的一个重要前提。
[0003]目前,国内外研究者对城市道路和高速公路的交通状态判别做了一些研究。最早投入开发和使用的ACI算法(基于交通检测装置的自动判别技术)是加利福尼亚算法,其通过比较临近环型线圈检测器获得的占有率数据,对可能存在的突发交通事件进行判别;Persaud,etc.根据突变理论,使用流量、占有率历史数据,开发一个流量

占有率分布关系模板,通过将观测数据与模板进行比较,判断交通的状态。史忠科等采用扩展Kalman滤波方法对高速公路交通密度进行预测;王亦兵等采用扩展Kalman滤波方法,建立了高速公路实时交通状态估计器;窦慧丽等提出了一种交通状态改了预报的K近邻非参数回归模型用于城市道路不同预报时长的分级交通状态的概率预报实验;皮晓亮等采用聚类分析方法,实现了一种基于环形线圈检测器采集信息的交通状态分类方法。然而,大部分现有对交通状态判别的研究中一般只着重于对交通状态的整体判别率,多数忽略了交通状态数据集的不平衡性,且很少对不同交通状态间的误判所可能产生的代价进行分析。
[0004]而现实中,交通流不同状态在实际中出现的频率存在很大差异,且不同交通状态之间的误判所造成的影响程度是不同的,样本数据中交通非拥堵情况多于拥堵情况,即数据存在不平衡,因此,可以认为交通状态判别是一个数据类别不平衡及代价敏感的分类问题。针对此问题,常见的方法有过采样以及欠采样技术,过采样包括样本插值技术和样本生成技术,如果只是单纯采用欠采样方法训练模型,那么训练集样本量偏少,会导致信息的丢失,训练出的模型的泛化能力以及鲁棒性势必不会太高,同时随机下采样的样本的选择是个问题,不同的采样模型的准确率以及泛化能力差异很大。有很多研究表明,代价敏感学习和样本不平衡问题有很强的联系,可以用相似的方式进行处理,并且使用代价敏感学习的方法解决不平衡学习问题要优于使用随机采样的方法。考虑到交通状态的判别中,交通状态误判情况的不同,所产生的代价不同,如果将顺畅误判为拥堵,可能仅仅增加了交通管理者的工作量,然而将拥堵误判为顺畅,可能会影响导航信息发布和应急措施启动的及时性。
[0005]为此,需要提出一种交通拥堵预判系统及方法。

技术实现思路

[0006]专利技术目的:本专利技术提供一种交通拥堵预判系统及方法,用于解决因交通状态误判造成影响权重不同导致数据类别不平衡及代价不同的问题。
[0007]技术方案如下:本专利技术提供一种交通拥堵预判系统,包括:数据处理模块,用于读取交通流的数据、对数据进行缺失值处理及异常值处理以进行数据清洗,清洗后的数据包
括类别特征数据、连续特征数据;并且数据处理模块用于对类别特征数据进行独热编码,对连续特征数据进行最大最小值归一化处理;以及数据处理模块用于采用Lasso回归方程筛选出编码处理或归一化处理后的交通流的数据中影响交通拥堵的变量特征,变量特征分为训练样本集、验证样本集,Lasso回归方程为:其中|w|1是权重向量w中各个元素的绝对值之和,α为用于控制惩罚力度的调节参数,y是真实样本的标签;X
w
是指一个样本的估计值,为多项式;X表示特征向量;w是估计参数,也是一个向量;模型构建训练模块,用于构建代价敏感神经网络模型并进行训练,以变量特征作为代价敏感神经网络模型的输入,用于定义加权交叉熵损失函数Loss为动态加权均方误差函数dyn_weight_cross_entropy_error(y,out
x
):
[0008]Loss=dyn_weight_cross_entropy_error(y,out
x
)=Weight*cross_entropy_error;其中,cross_entropy_error为批量交叉熵误差函数:其中,batchsize为每批次样本的数量;i为某一批次样本的序号,取值为1至batchsize;k表示类别数且相当于维数,y
k
表示样本正确的标签值,取值为1;out
xk
为神经网络的输出,是0至1之间的一个概率值;y是真实样本的标签,标签表示拥堵状态或顺畅状态,out
x
是神经网络的输出;并且,Weight为权重:Weight为权重:Weight=(1

true_label)*zero_weight+true_label*one_weight,其中,true_label为样本的真实标签,true_label取值为0或1,true_label取值为0表示训练样本集的真实标签为0且表示为非拥堵状态,true_label取值为1表示训练样本集的真实标签为1且表示为拥堵状态;zero_weight为交通顺畅的权重,one_weight为交通拥堵的权重;N表示真实标签中每批样本总数,N
P
表示真实标签中每批拥堵样本数,N
n
表示真实标签中每批顺畅样本数;预测评估模块,用于输出交通流处于拥堵状态的概率。
[0009]进一步的,所述变量特征包括道路因素、环境因素、人为因素。
[0010]进一步的,所述模型构建训练模块用于利用训练样本集中数据对该神经网络预测模型进行训练,用于选取验证样本集中数据对训练好的神经网络预测模型进行验证。
[0011]进一步的,所述模型构建训练模块用于采用早停法来防止训练过拟合。
[0012]进一步的,输出交通流处于拥堵状态的概率为1时,代表拥堵,输出交通流处于拥堵状态的概率为0时,代表顺畅。
[0013]本专利技术所述的交通拥堵预判系统,通过对交通拥堵样本数据处理,将代价敏感学习引入到神经网络模型中,自定义动态加权交叉熵损失函数,增大预测错交通拥堵的成本代价,验证了人工神经网络对预判的可行性和有效性,实现了有效降低拥堵和缓慢状态的误判率,解决了数据类别的不平衡问题。
[0014]本专利技术还提供一种交通拥堵预判方法,包括以下步骤:
[0015](1)读取交通流的数据,对数据进行缺失值处理及异常值处理以进行数据清洗;数据包括类别特征数据、连续特征数据;
[0016](2)对类别特征数据进行独热编码,对连续特征数据进行最大最小值归一化处理;
[0017](3)采用Lasso回归方程筛选出编码处理或归一化处理后的交通流的数据中影响交通拥堵的变量特征,变量特征分为训练样本集、验证样本集,Lasso回归方程为:
[0018][0019]其中,|w|1是权重向量w中各个元素的绝对值之和,α为用于控制惩罚力度的调节参数,y是真实样本的标签;X
w
是指本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种交通拥堵预判系统,其特征在于,包括:数据处理模块,用于读取交通流的数据、对数据进行缺失值处理及异常值处理以进行数据清洗,清洗后的数据包括类别特征数据、连续特征数据;并且数据处理模块用于对类别特征数据进行独热编码,对连续特征数据进行最大最小值归一化处理;以及数据处理模块用于采用Lasso回归方程筛选出编码处理或归一化处理后的交通流的数据中影响交通拥堵的变量特征,变量特征分为训练样本集、验证样本集,Lasso回归方程为:其中|w|1是权重向量w中各个元素的绝对值之和,α为用于控制惩罚力度的调节参数,y是真实样本的标签;X
w
是指一个样本的估计值,为多项式;X表示特征向量;w是向量估计参数;模型构建训练模块,用于构建代价敏感神经网络模型,以变量特征作为代价敏感神经网络模型的输入,用于定义加权交叉熵损失函数Loss为动态加权均方误差函数dyn_weight_cross_entropy_error(y,out
x
):Loss=dyn_weight_cross_entropy_error(y,out
x
)=Weight*cross_entropy_error;其中,cross_entropy_error为批量交叉熵误差函数:其中,batchsize为每批次样本的数量;i为某一批次样本的序号,取值为1至batchsize;k表示类别数且相当于维数,y
k
表示样本正确的标签值,取值为1;out
xk
为神经网络的输出,是0至1之间的一个概率值;y是真实样本的标签,标签表示拥堵状态或顺畅状态,out
x
是神经网络的输出;并且,Weight为权重:Weight=(1

true_label)*zero_weight+true_label*one_weight,其中,true_label为样本的真实标签,true_label取值为0或1,true_label取值为0表示训练样本集的真实标签为0且表示为非拥堵状态,true_label取值为1表示训练样本集的真实标签为1且表示为拥堵状态;zero_weight为交通顺畅的权重,one_weight为交通拥堵的权重;N表示真实标签中每批样本总数,N
P
表示真实标签中每批拥堵样本数,N
n
表示真实标签中每批顺畅样本数;预测评估模块,用于输出交通流处于拥堵状态的概率。2.根据权利要求1所述的交通拥堵预判系统,其特征在于,所述变量特征包括道路因素、环境因素、人为因素。3.根据权利要求2所述的交通拥堵预判系统,其特征在于,所述模型构建训练模块用于利用训练样本集中数据对该神经网络预测模型进行训练,用于选取验证样本集中数据对训练好的神经网络预测模型进行验证。4.根据权利要求3所述的交通拥堵预判系统,其特征在于,所述模型构建训练模块用于
采用早停法来防止训练过拟合。5.根据权利要求1所述的交通拥堵预判系统,其特征在于,输出交通流处于拥堵状态的概率为1时,代表交通流处于拥堵状态,输出交通流处于拥堵状态的概率为0时,代表交...

【专利技术属性】
技术研发人员:程娟娟宋家豪谢晓丽陆海红李鹏程张奥许金磊
申请(专利权)人:南京信息职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1