当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于改进随机森林的自适应交通事件检测方法技术

技术编号:27827700 阅读:26 留言:0更新日期:2021-03-30 11:17
本发明专利技术公开了一种基于改进随机森林的自适应交通事件检测方法,该方法包括:获取检测周期T内车辆出入相邻两个ETC门架的数据;计算交通参数;基于k

【技术实现步骤摘要】
一种基于改进随机森林的自适应交通事件检测方法


[0001]本专利技术涉及一种基于改进随机森林的自适应交通事件检测方法,属于路段交通事件检测领域。

技术介绍

[0002]随着国民人均汽车保有量的上升,加上道路网越来越复杂,道路交通事件频发,如交通拥挤、交通事故和道路施工等,不仅降低了道路通行能力,也危害着出行者的交通安全。准确实时的交通事件检测不仅可以为出行者提供及时准确的道路事件信息,使出行者合理规划出行路线,从而保证道路通行能力,也可以使管理者及时获取事件信息,对道路交通事件进行迅速处理,从而减少交通延误,避免二次事故的发生,提升交通安全。因此,提升交通事件检测算法的准确性和实时性具有重要意义。
[0003]随着人工智能技术的飞速发展,人们开始将先进的人工智能算法应用到交通管理系统中来,有效地检测交通事件,并迅速响应和及时处置。代表算法有神经网络、模糊逻辑、随机森林、支持向量机和K近邻等,其中性能最好的是随机森林算法,具有训练速度快、不易过拟合、检测精度高的优点。但是对于不平衡样本集,随机森林算法的检测结果偏向于训练数据中数量较多的类别。由于交通事件数据属于不平衡样本,因此采用随机森林算法进行事件检测时必须对训练样本进行重抽样,产生平衡样本。
[0004]同时,以往采用人工智能算法进行的事件检测都没有考虑到算法随着时间改变发生的检测性能变化,这也是由人工智能算法训练时间过长这一缺点导致的。因此,虽然人工智能算法检测效率和检测精度高,但是很少应用于实际的道路交通事件检测系统中。基于此,研究人工智能算法的自适应性,对更加高效准确地检测交通事件以及提升事件检测算法在现实中的应用性具有重要意义。

技术实现思路

[0005]本专利技术所要解决的技术问题是:提供一种基于改进随机森林的自适应交通事件检测方法,针对传统基于随机森林的交通事件检测方法未考虑训练样本的数据平衡问题和算法的自适应调整问题,导致检测结果可靠度不高的缺点,提出了一种基于k

means聚类重抽样的改进随机森林交通事件检测算法,同时根据历史误检率对算法进行自适应调整,以提升事件检测的准确性和实时性。
[0006]本专利技术为解决上述技术问题采用以下技术方案:
[0007]一种基于改进随机森林的自适应交通事件检测方法,包括如下步骤:
[0008]步骤1,定义某相邻两个ETC门架之间的路段为检测路段,按车辆行驶方向将车辆先经过的ETC门架定义为上游门架,后经过的ETC门架定义为下游门架,获取检测周期T内进入上游门架的每辆车的车牌及对应的进入时间数据,获取检测周期T内离开下游门架的每辆车的车牌及对应的离开时间数据;
[0009]步骤2,根据步骤1获取的数据,计算检测周期T对应的交通参数,所述交通参数包
括流量、路段平均速度和速度离散特征;
[0010]其中,速度离散特征的计算公式如下:
[0011][0012]式中,c
v
表示速度离散特征,表示路段平均速度,σ
v
表示车速标准差,且
[0013][0014]v
i
表示第i辆车的单车速度,n为在检测周期T内进入上游门架并离开下游门架的车辆总数即流量;
[0015]步骤3,针对上述检测路段,采用一周时间内以检测周期T为间隔所计算得到的交通参数以及每个检测周期T该检测路段的事件情况作为历史数据集,历史数据集中的每条数据包括:检测周期T的序号、流量、路段平均速度、速度离散特征和事件情况,事件情况为有事件或无事件;
[0016]步骤4,对历史数据集采用k

means聚类抽样生成平衡样本集,具体为:
[0017]步骤41,根据事件情况,将历史数据集分为两类:有事件数据集和无事件数据集;
[0018]步骤42,从有事件数据集中随机取出k条数据作为聚类中心,初始化聚类中心;
[0019]步骤43,利用欧式距离计算其他数据到聚类中心的距离,将有事件数据集中的其他数据分配到距离最近的类中,得到k个类别;
[0020]步骤44,重新计算各个聚类的中心,判断是否收敛,若否,则转入步骤43,若是,则进入步骤45;
[0021]步骤45,从无事件数据集中随机取出m条数据作为聚类中心,初始化为聚类中心,采用步骤43

44相同的方法对无事件数据集进行聚类,得到m个类别;
[0022]步骤46,使用过采样的方法对步骤43得到的k个类别进行过采样,得到正类过采样集合;
[0023]步骤47,根据正类过采样集合中正类的个数,计算负类的过采样个数,并从步骤45得到的m个类别中进行负类过采样,得到负类过采样集合,将正类过采样集合与负类过采样集合一起作为平衡样本集;
[0024]步骤5,对步骤4重复N次得到N个平衡样本集,用一个平衡样本集构建一个决策树,得到N个决策树,N个决策树的集合即为用于事件检测的随机森林模型;
[0025]步骤6,获取待检测的检测周期的交通参数,将交通参数输入用于事件检测的随机森林模型并输出事件检测结果;
[0026]步骤7,利用步骤5得到的模型对待检测的检测周期之前的第13个检测周期至第2028个检测周期进行事件检测,得到检测结果,与实际结果进行比较,计算误检率,根据误检率对模型进行自适应调整。
[0027]作为本专利技术的一种优选方案,步骤2所述路段平均速度的计算公式如下:
[0028][0029]式中,表示路段平均速度,n为在检测周期T内进入上游门架并离开下游门架的车
辆总数即流量,v
i
表示第i辆车的单车速度,且
[0030][0031]l表示检测路段的长度,t1表示第i辆车离开下游门架的时间,t2表示第i辆车进入上游门架的时间。
[0032]作为本专利技术的一种优选方案,步骤5所述用一个平衡样本集构建一个决策树,所采用的算法为决策树ID3算法。
[0033]作为本专利技术的一种优选方案,所述步骤7的具体过程如下:
[0034]步骤71,令待检测的检测周期为t,利用步骤5得到的模型对第t

13个检测周期至第t

2028个检测周期进行事件检测,得到检测结果;
[0035]步骤72,将检测结果与实际结果进行比较,计算误检率,误检率计算公式如下:
[0036][0037]式中,FAR表示误检率,FA表示错误检测次数,Nt表示总检测次数;
[0038]步骤73,设定误检率阈值,若误检率未超过误检率阈值则进入下一检测周期进行事件检测,若超过误检率阈值则进入步骤74;
[0039]步骤74,对于第t

13个检测周期至第t

2028个检测周期,获取各检测周期的交通参数和事件情况,生成新的数据集;
[0040]步骤75,对新的数据集进行k

means聚类抽样生成新的平衡样本集,利用新的平衡样本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进随机森林的自适应交通事件检测方法,其特征在于,包括如下步骤:步骤1,定义某相邻两个ETC门架之间的路段为检测路段,按车辆行驶方向将车辆先经过的ETC门架定义为上游门架,后经过的ETC门架定义为下游门架,获取检测周期T内进入上游门架的每辆车的车牌及对应的进入时间数据,获取检测周期T内离开下游门架的每辆车的车牌及对应的离开时间数据;步骤2,根据步骤1获取的数据,计算检测周期T对应的交通参数,所述交通参数包括流量、路段平均速度和速度离散特征;其中,速度离散特征的计算公式如下:式中,c
v
表示速度离散特征,表示路段平均速度,σ
v
表示车速标准差,且v
i
表示第i辆车的单车速度,n为在检测周期T内进入上游门架并离开下游门架的车辆总数即流量;步骤3,针对上述检测路段,采用一周时间内以检测周期T为间隔所计算得到的交通参数以及每个检测周期T该检测路段的事件情况作为历史数据集,历史数据集中的每条数据包括:检测周期T的序号、流量、路段平均速度、速度离散特征和事件情况,事件情况为有事件或无事件;步骤4,对历史数据集采用k

means聚类抽样生成平衡样本集,具体为:步骤41,根据事件情况,将历史数据集分为两类:有事件数据集和无事件数据集;步骤42,从有事件数据集中随机取出k条数据作为聚类中心,初始化聚类中心;步骤43,利用欧式距离计算其他数据到聚类中心的距离,将有事件数据集中的其他数据分配到距离最近的类中,得到k个类别;步骤44,重新计算各个聚类的中心,判断是否收敛,若否,则转入步骤43,若是,则进入步骤45;步骤45,从无事件数据集中随机取出m条数据作为聚类中心,初始化为聚类中心,采用步骤43

44相同的方法对无事件数据集进行聚类,得到m个类别;步骤46,使用过采样的方法对步骤43得到的k个类别进行过采样,得到正类过采样集合;步骤47,根据正类过采样集合中正类的个数,计算负类的过采样个数,并从步骤45得到的m个类别中进行负类过采样,得到负类过采样集合,将正类过采样集合与负类过采样集合一起作为平衡样本集;步骤5,对步骤4重复N次得到N个平衡样本集,用一个平衡样本集构建一个决策树,得到N个决策树...

【专利技术属性】
技术研发人员:程小洋郭建华
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1