一种基于聚类与深度序列学习的交通状态估计方法技术

技术编号:24519046 阅读:35 留言:0更新日期:2020-06-17 07:17
本发明专利技术提供了一种基于kmeans聚类与深度序列学习的交通状态估计方法,属于智能交通系统领域,主要解决在城市快速路中部分路段的交通流数据无法实时获取的情况下,实现对整个快速路的交通状态进行估计的问题。其特征在于,所述方法包括步骤如下:(1)快速路网划分;(2)快速路的建模与数据采集;(3)数据预处理与归一化;(4)通过kmeans聚类算法计算交通流数据间的欧氏距离,确定各数据点的交通状态等级;(5)深度序列学习Seq2Seq模型的设计,通过模型迭代学习对整个路网进行交通状态识别。本发明专利技术充分考虑了路段之间交通流的关系,发挥机器学习算法在交通领域的优势,及时得到整个路网的交通状态,可以为驾驶主体提供可靠的交通信息。

A traffic state estimation method based on clustering and deep sequence learning

【技术实现步骤摘要】
一种基于聚类与深度序列学习的交通状态估计方法
本专利技术涉及智能交通系统领域,具体涉及一种基于kmeans聚类与深度序列学习的交通状态估计方法。
技术介绍
随着我国社会经济的不断发展与城市人口的持续增长,越来越多的家庭拥有了一辆甚至多辆私人汽车,快速增长的车辆数导致我国各大城市的交通压力日益增加,严重影响了城市交通路网的运行效率,增加居民的出行时间,此外,车辆在拥堵时低速行驶会加剧能源的浪费,频繁的熄火和发动也会加大尾气的排放量,污染居民生活环境。因此,如何在满足人们出行的需求条件下,对城市路网的交通流进行准确估计,缓解交通压力,已经成为交通管理发展的重要方向与学术界的研究焦点。交通状态估计指的是利用路网中观测到的交通流数据推断出整个路网交通状态的过程。目前主要分为基于模型驱动与基于数据驱动两类算法:模型驱动算法一般用交通流模型来描述路段之间的传输关系,通过数学公式推演出交通状态变化情况;数据驱动算法通常使用机器学习来分析历史交通流数据并挖掘出数据之间的关系,进而估计或预测出路段交通状态。然而,受限于技术和资金等原因,目前城市路网的道路检测器还无法做到无缝覆盖,仅能检测到部分路段的交通流数据,导致现有的技术大多围绕着单条路段做研究,无法对未检测到数据的路段进行有效估计,无法满足出行人群对于路网交通信息的需求。因此针对上述问题还没有提出有效的解决方案。
技术实现思路
本专利技术的目的在于针对上述存在的问题,提供一种基于kmeans聚类与深度序列学习的交通状态估计方法,旨在解决城市快速路中部分路段的交通流数据无法实时获取的情况下,对全部路段的交通状态进行估计的问题。本专利技术的技术方案按以下步骤进行实施:S1、快速路划分:按照元胞传输模型CTM理论将一条城市快速路划分成若干个均衡的路段,保证划分后各路段内部的交通流密度呈均匀分布,截面流量、车流速度等大致相同;S2、数据采集:采用仿真软件对选中的快速路进行建模,设置虚拟检测器,获取各路段交通流的历史参数数据,其中数据的特征包括路段截面车流量、速度与路段时间占有率;S3、数据预处理:剔除收集到的重复数据与异常数据,并将不同的交通流特征数据进行归一化处理,转换成[0,1]区间的值;S4、交通状态划分:按照路段交通流基本图特性将交通状态分为自由流与拥挤流两种状态等级,采用kmeans聚类算法分别对各路段的历史交通流数据进行聚类分析,根据数据在三维空间中的欧式距离来判断每个数据点的类别,从而达到对各路段数据集标定的目的;S5、交通状态估计:将标定好的数据按一定比例构造训练数据集,并设计深度序列学习模型Seq2Seq模型,模型输入是快速路中部分路段的交通流数据序列,输出是快速路全部路段的交通状态序列,通过迭代学习的方式实现对整个路段的交通状态估计,得到估计结果。进一步的,所述步骤S1中,快速路的路段划分规则为:S1.1、按照快速路网中匝道的数量和位置、车道数变化位置以及道路曲率半径发生变化的位置,可将路网分割为若干路段,每个路段称为一个链接路段;所述匝道包括入口匝道和出口匝道,所述车道数变化为增加或减少;S1.2、每个链接路段按照其长度被进一步分割为若干个长度相等的更小的路段,每个小路段称为一个元胞,且保证每个元胞是均衡的。进一步的,所述步骤S2中,快速路模型按照S1所述的路段划分规则进行划分,并按照真实数据动态的设置各路段交通需求以及出入口匝道与主路之间的分流比,使得仿真出来的交通流可以按照真实交通流变化情况进行演变。各路段采集到的历史交通流参数数据可以是连续多个工作日的数据,通过改变软件随机种子的方式来模拟。进一步的,所述步骤S3中,由于交通流数据不同特征变量之间的量纲相差较大,如交通流量能达到数百上千,而交通流速度仅有几十,直接用于后续的模型训练会导致结果不准确。因此,需要对收集到的数据做归一化处理,使不同特征变量能落在一个特定区域内,归一化公式为:其中:x'为数据归一化后的值,x为数据归一化前的值,xmin为数据集中的最小值,xmax为数据集中的最大值。进一步的,所述步骤S4中,根据元胞内部交通流数据构成的基本图划分交通状态等级,共分成自由流与拥挤流两种类型,其中自由流状态下的交通运行比较稳定,行驶车辆几乎不受外界影响,用数字0来表示该状态;拥挤流状态下的交通运行极不稳定,车辆间干扰剧烈,用数字1来表示该状态。进一步的,所述步骤S4中,采用kmeans聚类算法对历史交通流参数数据进行聚类,对每一组的历史交通流参数数据进行标定(0或1状态),并计算出不同交通状态类别数据的均值,比较差异,其中,聚类算法具体步骤如下所示:S4.1、确定聚类类别个数k,随机从数据集中选取k个数据点作为初始聚类中心;S4.2、分别计算各数据点到聚类中心之间的欧式距离,将它划分到离的较近的聚类中心所在的类别中,计算公式表示为:其中,xi为数据集中第i个数据点,μj为第j个聚类类别的中心点,k为聚类类别个数。S4.3、根据聚类结果计算不同类别包含数据点的算数平均值,用该值代替之前的聚类中心点,更新公式表示为:其中,cj为第j个聚类类别包含的数据点个数。S4.4、比较当前聚类中心点与更新前中心点的区别,若相同,则迭代停止,算法结束;若不同,则返回到步骤S4.2,继续迭代。进一步的,所述步骤S4中,所述算法的目标函数表示为:其中,E表示算法的平方误差,Cj表示第j个聚类簇。进一步的,所述步骤S5中,所述的深度序列Seq2Seq模型是一种“多对多”结构的模型,在对模型进行训练前需要提前拟合好模型的输入及输出数据,将快速路网的交通流数据和状态数据按空间顺序排列起来,得到路段一一相对应的路网交通流数据(连续)序列与交通状态(离散)二进制序列,将交通流数据序列作为输入,状态序列作为输出来训练Seq2Seq模型。此外,由于实际路网上有部分路段的数据无法实时获取,所以在训练模型时需要将输入序列中那部分路段的数据给清除掉,以便训练出的模型在未来估计过程中能以部分路段的数据估计出整个快速路的状态序列。进一步的,所述步骤S5中,所述的Seq2Seq模型由两层LSTM神经网络构成,以便解决RNN神经网络所面临的梯度消失与梯度爆炸问题。采用前一层LSTM网络作为编码器,负责解析输入的交通流数据序列,编码器公式表示为:ht=f(ht-1,xt)(5)其中,f表示编码器的激活函数,xt表示在t时刻的交通流数据序列,ht表示在t时刻编码器的隐藏状态。采用后一层LSTM网络作为解码器,负责解析编码器的输出,按照一定规则计算出整个快速路的交通状态概率分布序列,解码器与模型输出公式表示为:st=f(st-1,yt-1,c)(6)p(yt|yt-1,yt-2,...,y1,c)=g(st,yt-1,c)(7)其中,f表示解码器的激活函数,c表示编码器的输出结果,st表示在t时刻解码器本文档来自技高网...

【技术保护点】
1.一种基于聚类与深度序列学习的交通状态估计方法,其特征在于,该方法包括如下步骤:/nS1、快速路划分:按照元胞传输模型CTM理论将一条城市快速路划分成若干个均衡的路段,保证划分后各路段内部的交通流密度呈均匀分布,截面流量、车流速度等大致相同;/nS2、数据采集:采用仿真软件对选中的快速路进行建模,设置虚拟检测器,获取各路段交通流的历史参数数据,其中数据的特征包括路段截面车流量、速度与路段时间占有率;/nS3、数据预处理:剔除收集到的重复数据与异常数据,并将不同的交通流特征数据进行归一化处理,转换成[0,1]区间的值;/nS4、交通状态划分:按照路段交通流基本图特性将交通状态分为自由流与拥挤流两种状态等级,采用kmeans聚类算法分别对各路段的历史交通流数据进行聚类分析,根据数据在三维空间中的欧式距离来判断每个数据点的类别,从而达到对各路段数据集标定的目的;/nS5、交通状态估计:将标定好的数据按一定比例构造训练数据集,并设计深度序列学习模型Seq2Seq模型,模型输入是快速路中部分路段的交通流数据序列,输出是快速路全部路段的交通状态序列,通过迭代学习的方式实现对整个路段的交通状态估计,得到估计结果。/n...

【技术特征摘要】
1.一种基于聚类与深度序列学习的交通状态估计方法,其特征在于,该方法包括如下步骤:
S1、快速路划分:按照元胞传输模型CTM理论将一条城市快速路划分成若干个均衡的路段,保证划分后各路段内部的交通流密度呈均匀分布,截面流量、车流速度等大致相同;
S2、数据采集:采用仿真软件对选中的快速路进行建模,设置虚拟检测器,获取各路段交通流的历史参数数据,其中数据的特征包括路段截面车流量、速度与路段时间占有率;
S3、数据预处理:剔除收集到的重复数据与异常数据,并将不同的交通流特征数据进行归一化处理,转换成[0,1]区间的值;
S4、交通状态划分:按照路段交通流基本图特性将交通状态分为自由流与拥挤流两种状态等级,采用kmeans聚类算法分别对各路段的历史交通流数据进行聚类分析,根据数据在三维空间中的欧式距离来判断每个数据点的类别,从而达到对各路段数据集标定的目的;
S5、交通状态估计:将标定好的数据按一定比例构造训练数据集,并设计深度序列学习模型Seq2Seq模型,模型输入是快速路中部分路段的交通流数据序列,输出是快速路全部路段的交通状态序列,通过迭代学习的方式实现对整个路段的交通状态估计,得到估计结果。


2.根据权利要求1所述的一种基于聚类与深度序列学习的交通状态估计方法,其特征在于,所述步骤S1中,快速路的路段划分规则为:
S1.1、按照快速路网中匝道的数量和位置、车道数变化位置以及道路曲率半径发生变化的位置,可将路网分割为若干路段,每个路段称为一个链接路段;所述匝道包括入口匝道和出口匝道,所述车道数变化为增加或减少;
S1.2、每个链接路段按照其长度被进一步分割为若干个长度相等的更小的路段,每个小路段称为一个元胞,且保证每个元胞是均衡的。


3.根据权利要求1所述的一种基于聚类与深度序列学习的交通状态估计方法,其特征在于,所述步骤S2中,快速路模型按照S1所述的路段划分规则进行划分,并按照真实数据动态的设置各路段交通需求以及出入口匝道与主路之间的分流比,各路段采集到的历史交通流参数数据可以是连续多个工作日的数据,通过改变软件随机种子的方式来模拟。


4.根据权利要求1所述的一种基于聚类与深度序列学习的交通状态估计方法,其特征在于,所述步骤S3中,对收集到的数据做归一化处理,使不同特征变量能落在一个特定区域内,归一化公式为:



其中,x'为数据归一化后的值,x为数据归一化前的值,xmin为数据集中的最小值,xmax为数据集中的最大值。


5.根据权利要求1所述的一种基于聚类与深度序列学习的交通状态估计方法,其特征在于,所述步骤S4中,根据元胞内部交通流数据构成的基本图划分交通状态等级,共分成自由流与拥挤流两种类型,其中自由流状态时的交通运行比较稳定,行驶车辆几乎不受外界影响,用数字0来表示该状态;拥挤流状态时的交通运行极不稳定,车辆间干扰剧烈,用数字1来表示该状态。


6.根据权利要求1所述的一种基于聚类与深度序列学习的交通状态估计方法,其特征在于,所述步骤S4中,采用kmeans聚类算法对历史交通流参数数据进行聚类,对每一组的历史交通流参数数据进行标定(0或1状态),并计算出不同交通状态类别数据的均值,比较差异,其中,聚类算法...

【专利技术属性】
技术研发人员:陈阳舟马鹏飞师泽宇
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1