当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于核密度估计和孤立森林算法的车辆异常识别方法技术

技术编号:37496574 阅读:32 留言:0更新日期:2023-05-07 09:33
本发明专利技术公开了一种基于核密度估计与孤立森林算法的车辆异常识别方法,包括:对通过高速公路两两相邻的ETC门架的行车数据进行时空匹配;根据ETC时空匹配数据,得到通过两两相邻ETC门架的所有车辆的行程时间;设置行程时间阈值,筛选出有效行程时间记录;根据车辆行程时间历史数据,得到一天内每个时间段的行程时间条件概率密度函数估计;根据估计的行程时间条件概率密度函数,建立行程时间分布模型;根据历史行程时间数据训练构建孤立森林模型,检测历史数据中的异常点;根据不同时段的行程时间分布函数,检测出历史行程时间数据中的异常值,生成基于不同时段的车辆行程时间异常判定标准。本发明专利技术可适用于基于ETC数据的高速公路异常车辆识别。异常车辆识别。异常车辆识别。

【技术实现步骤摘要】
一种基于核密度估计和孤立森林算法的车辆异常识别方法


[0001]本专利技术属于智能交通信息
,具体涉及一种基于核密度估计和孤立森林算法的车辆异常识别方法,可适用于高速公路已部署ETC门架装置的异常车辆识别。

技术介绍

[0002]近年来,随着汽车保有量的急剧增加,我国高速公路交通事故发生数量也持续上升。而相关机构调查研究专利技术,驾驶行为异常是造成交通事故发生的主要因素。如果异常车辆不能及时发现和管控,轻则会增加交通拥堵,降低道路通行能力,重则会引发交通事故,造成人员伤亡及巨大的经济损失。因此,识别道路中异常车辆,并对异常车辆进行及时干预,将有助于避免部分的交通安全风险,减少因异常驾驶而造成的交通事故发生,这对提升交通道路安全水平具有重要意义。
[0003]通过查阅车辆异常识别相关的专利和论文,现有的方法大多利用汽车内置加速度计、陀螺仪、磁力计等多种传感设备收集的车辆行驶状态的微观数据,通过大量数据训练神经网络,往往能得到较高的的异常识别准确率及驾驶行为分类。但由于数据来源依赖于传感器设备,车辆部署率较低,暂未全面覆盖,数据采集难本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于核密度估计与孤立森林算法的车辆异常识别方法,其特征在于,包括以下步骤:步骤1:获取高速公路ETC数据,对通过两两相邻的ETC门架的行车数据进行时空匹配,确定每辆车的ETC时空匹配数据;步骤2:根据每辆车的ETC时空匹配数据,计算得到通过两两相邻ETC门架的所有车辆的行程时间;步骤3:根据设置的行程时间阈值,从所有车辆的行程时间中筛选出有效行程时间记录;步骤4:根据车辆行程时间历史数据,利用无分布核密度函数估计器得到一天内每个采样时段的行程时间条件概率密度函数估计;步骤5:根据估计的行程时间条件概率密度函数,利用函数型主成分分析法建立行程时间分布模型;步骤6:根据历史行程时间数据训练构建孤立森林模型,所述孤立森林模型用于检测历史数据中的异常点;步骤7:根据不同时段的行程时间分布函数,利用孤立森林算法检测出历史行程时间数据中的异常值,生成基于不同时段的车辆行程时间异常判定标准。2.根据权利要求1所述的基于核密度估计与孤立森林算法的车辆异常识别方法,其特征在于,所述步骤2的具体过程如下:确定时间窗,以一定时间间隔计算得到一天内不同时段的两两相邻ETC门架的每辆车的行程时间的行程时间式中,代表某辆车在所选路段上ETC门架i到j之间在时段k内的行程时间;和分别表示k时段内经过ETC门架i与j的时间,车辆行驶方向为从ETC门架i至j,即ETC门架i代表道路上游处采集点,ETC门架j表示道路下游处采集点。3.根据权利要求1所述的基于核密度估计与孤立森林算法的车辆异常识别方法,其特征在于,所述步骤4的具体过程如下:步骤4.1:设置单位时间长度为一天,并在一天内设置采样时间间隔为10分钟;步骤4.2:根据所述采样时间间隔,在采样时间点处获取一天内不同出发时间的车辆行程时间数据集,采样时间点的个数即为数据集样本个数;步骤4.3:根据所述行程时间数据集,运用无参数核密度估计进行拟合,则,第k个时段的核密度估计公式为:式中,K(
·
)为核函数;h为带宽;
n为行程时间样本集总数量;x为当前所求样本;x
k,l
为处于时段k中的样本集中的第l个样本;为时段k所对应数据集的密度函数。4.根据权利要求1所述的基于核密度估计与孤立森林算法的车辆异常识别方法,其特征在于,所述步骤5的具体过程如下:步骤5.1:根据行程时间在一天中不同时段的非平稳性,将每个时间段的行程时间概率密度函数采用Karhunen

Lo
è
ve展开为随机函数:式中,m为随机分量的标号;μ(x)为均值函数;为第m个随机分量的特征函数特征函数;ξ
m
为中心化函数f(x)

μ(x)在特征函数上的投影得分;步骤5.2:将步骤5.1中Karhunen

Lo
è
ve表达式中的随机部分视为不同时段对行程时间的影响,结合步骤4.3中根据ETC行程时间历史数据拟合的核密度估计密度函数对其进行函数主成分分析,得到步骤5.1模型内各成分的估计函数及函数型行程时间密度估计模型:模型:为估计均值函数,α0(x)为核密度函数局部线性最小化时得到,即下式最小化时的α0取值:其中,L1表示第一目标函数,k表示时段的标号,K表示一天内时段总数量,m表示随机分量的标号,M表示随机分量总数量,α0表示待定系数,α1表示待定系数,x
m
表示第m个随机分量的行程时间样本值;为估计特征函数,为特征值,由特征方程可得:其中,G
k

【专利技术属性】
技术研发人员:孙棣华赵敏黄嫘英
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1