一种基于车辆轨迹时空特征分析的黑车智能发现方法技术

技术编号:10898349 阅读:186 留言:0更新日期:2015-01-12 19:29
本发明专利技术提供一种基于车辆轨迹时空特征分析的黑车智能发现方法。本发明专利技术首先提取城市小型车车辆列表,并剔除合法运营出租车,其次对于特定排查期,提取车辆列表中所有车辆在排查期的卡口过车记录数据,进而从过车记录数据中初步筛选得出嫌疑黑车列表;然后选择数据挖掘分析样本,提取车辆时空特征数据,接着采用支持向量机算法训练黑车分类器模型,最后将嫌疑黑车列表中的所有嫌疑黑车特征数据作为测试集输入训练的分类器模型进行分类判定。本发明专利技术改变了传统黑车人工排查方法,分析更加智能高效,对车辆行为特征进行多维度提取,通过对训练样本数据进行样本交叉训练消除过拟合问题。

【技术实现步骤摘要】
一种基于车辆轨迹时空特征分析的黑车智能发现方法
本专利技术涉及基于车辆轨迹时空特征分析的黑车智能发现方法,特别涉及一种基于对车辆轨迹时空特征数据进行挖掘分析进而从大量车辆轨迹时空特征数据中发现黑车的方法。
技术介绍
当前,许多城市黑车营运的现象日益严重、屡禁不止,成为困扰各地交通运输管理部门的难题。黑车营运不仅扰乱城市客运市场秩序,侵害合法经营者的利益,影响城市的文明形象,而且严重地影响着人民群众的生命财产安全和和谐社会的构建。目前执法机关抓获黑车主要通过蹲点排查、钓鱼执法、群众举报等方法,这些抓获方法难度大、收获少。虽然许多城市道路都安装了电子摄像头、智能卡口和电子警察设备,但是目前尚没有利用这些设备采集的数据进行科学智能分析从而自动发现黑车的方法。
技术实现思路
本专利技术针对目前人工排查黑车收效甚微的问题,提供了一种基于车辆轨迹时空特征分析的黑车发现方法,该方法有较高的黑车发现精度,同时随着发现的黑车数量增加,可进一步将确认的黑车加入模型正向样本对模型训练反馈,不断提升算法判定精度。通过该专利技术描述的黑车发现方法,可极大减少人工排查的周期和投入人力,提高经济效益。本专利技术技术解决方案:基于车辆轨迹时空特征分析的黑车智能发现方法,包括如下步骤:步骤1、提取城市小型车车辆列表,并剔除合法运营出租车;步骤2、对于特定排查期,提取步骤1车辆列表中所有车辆在排查期的卡口过车记录数据;步骤3、从步骤2的过车记录数据中初步筛选得出嫌疑黑车列表,所述的嫌疑黑车的判断条件为:在该排查期内,超过R天的行为数据满足以下条件:(1)当日产生的卡口过车记录数大于设定第一阈值m;(2)当日经过的卡口个数大于设定第二阈值n;如果某辆车辆,有超过R天满足以上条件,则将其作为嫌疑黑车供后续模型进一步判断,依此筛选出所有嫌疑黑车列表,作为步骤4中黑车判断模型输入;步骤4、数据挖掘分析样本选择;所述的数据挖掘分析样本包括正向样本和负向样本:正向样本为所有在册合法运营出租车行为数据,负向样本为典型私家车、警用车行为数据;因为黑车与合法运营出租车有相似的轨迹行为特征,而典型私家车和警用车与黑车在行为轨迹上特征相差较大,因此将合法运营出租车的行为数据作为正向样本、典型私家车和警用车的行为数据作为负向样本训练分类器模型;步骤5、提取步骤4中选择的样本车辆的时空特征数据,该时空特征数据包括车辆分别在工作日和节假日在一天当中不同时间段平均过车记录数,在一级卡口、二级卡口、三级卡口一天当中不同时间段的平均过车记录数,经过的一级卡口、二级卡口、三级卡口数数据;步骤6、利用步骤5得到的样本车辆时空特征数据,采用支持向量机算法训练黑车分类器模型,利用该模型能够对所需判断车辆进行判别并返回车辆是否属于黑车;步骤7、将步骤3中产生的嫌疑黑车列表中的所有嫌疑黑车特征数据作为测试集输入步骤六中训练的分类器模型进行分类判定,获取最终模型得到的黑车列表。所述步骤5中提取车辆时空特征数据的具体步骤如下:步骤5.1、对所有电子卡口设备按照过车记录频次进行分级,设分为L个等级;步骤5.2、提取车辆初始的s个时空特征数据,将该s个时空特征数据形式化描述为F={f1,f2,...,fs};步骤5.3、特征细化,对所述步骤5.2中的s个特征F={f1,f2,...,fs},根据特征取值的分布情况,按照特征值相近的聚类原则;所述根据特征取值的分布情况是指特征取值大小的分布,进行聚类,能将尽可能将相近的值归为相同类,进一步离散化,转化为特征相似性越容易判断的更细粒度的特征集合FN={f1,f2,...,fq}。所述步骤6中采用分类算法训练黑车分类器模型M(F)过程如下:步骤6.1、对于特征集合FN={f1,f2,...,fq}进行归一化处理,去除特征值为0的特征,同时标记特征顺序,得到归一化后的特征集合FNA{i|fi=1,fi∈FN};步骤6.2、选择分类算法,将正向样本和负向样本特征数据代入分类算法进行模型训练;步骤6.3、交叉训练最优模型参数,使得模型M(F)针对样本分类具有最高精度。所述步骤5.3转化为特征相似性越容易判断的更细粒度的特征以下步骤:步骤5.3.1、对于5.2中获取的初始特征fi,得到样本的初始特征fi取值集合其中sum为样本总数;步骤5.3.2、对中的数值进行一维聚类,得到质心集合C={C1,C2,...,Cp};步骤5.3.3、将步骤5.3.2中质心集合C作为分界点对初始特征fi细化为{f′1,f′2,...,f′p+1}的p+1个特征,p为需要聚类的类数,对于特征fi'其取值V(fi')为:valuei表示初始特征fi的第i个样本取值,Ci为质心集合第i个质心;步骤5.3.4、对集合F中所有特征f1,f2,...,fs,重复步骤5.3.1、5.3.2、5.3.3,得到细化后特征集合FN={f1,f2,...,fq};q为对于所有初始特征进行相似性特征聚类后获取得到的最终特征个数的总数值;Centroidi表示初始特征fi的值聚类后得到的质心集合;C(Centroidi)表示初始特征fi对应的Centroidi的大小。所述步骤3中的R取值为不小于排查期的1/3的天数,即如果排查期为一个月30天,则R取值不小于10,且不大于30。所述步骤3中第一阈值m取值范围通常为1-100,第二阈值n取值范围为1-80。所述步骤3中p取值为1-20的整数。本专利技术的优点与积极效果在于:(1)本专利技术改变了传统的黑车人工排查方法,通过对电子卡口设备采集的大规模车辆卡口过车记录数据进行智能分析来发现黑车,更加快速高效。(2)本专利技术对车辆行为特征进行多维度提取,包括车辆的工作日、节假日等运行时间、运行轨迹维度,对于同一天的不同时段等多个维度时空特性的细化和提取,通过对训练样本数据进行样本交叉训练,消除过拟合问题,提高分类器正确率。(3)本专利技术扩展性较强,随着获得的车辆信息更加全面,通过加入更多维度特征数据,可以进一步提高黑车判别模型的准确率。附图说明图1为本专利技术中黑车判定模型;图2为本专利技术中统计学黑车判定模型;图3为本专利技术中特征细化过程;图4为本专利技术中采用SVM算法训练分类器过程;图5为本专利技术中交叉训练最优参数过程。具体实施方式利用本专利技术的步骤a-g,创建一套智能分析发现黑车的方法,并利用该方法找出一个城市的黑车来验证本文的专利技术。图1是本专利技术黑车智能发现模型的概图,该发现模型首先通过一个统计模型获取初步嫌疑黑车,再将该初步嫌疑黑车作为数据挖掘模型的输入,进一步得到更加精确的嫌疑黑车列表。步骤a、根据某城市电子卡口数据获取2014年1月所有车辆列表,利用车辆基础信息表提取小型车车辆列表,并剔除合法运营出租车,得到车辆共701219辆;步骤b、提取步骤a中得到的车辆列表中所有车辆的电子卡口过车记录数据;步骤c、从步骤b的过车记录数据中初步筛选得出嫌疑黑车列表,嫌疑黑车的判定条件为:在2014年1月内,超过10天的行为数据满足以下条件:1)当日产生的卡口过车记录数大于阈值50;2)当日经过的卡口个数大于阈值20;图2给定的每天活跃次数阈值m为50,每天经过卡口数阈值n为20,R取值为10,经过以上统计过滤,初步筛选得出的嫌疑黑车11231辆。步骤d、数据挖掘分析样本选择;正向样本:所有在本文档来自技高网...
一种基于车辆轨迹时空特征分析的黑车智能发现方法

【技术保护点】
一种基于车辆轨迹时空特征分析的黑车智能发现方法,其特征在于实现步骤如下:步骤1、提取城市小型车车辆列表,并剔除合法运营出租车;步骤2、对于特定排查期,提取步骤1车辆列表中所有车辆在排查期的卡口过车记录数据;步骤3、从步骤2的过车记录数据中初步筛选得出嫌疑黑车列表,所述的嫌疑黑车的判断条件为:在该排查期内,超过R天的行为数据满足以下条件:(1)当日产生的卡口过车记录数大于设定第一阈值m;(2)当日经过的卡口个数大于设定第二阈值n;如果某辆车辆,有超过R天满足以上条件,则将其作为嫌疑黑车供后续模型进一步判断,依此筛选出所有嫌疑黑车列表,作为步骤4中黑车判断模型输入;步骤4、数据挖掘分析样本选择;所述的数据挖掘分析样本包括正向样本和负向样本:正向样本为所有在册合法运营出租车行为数据,负向样本为典型私家车、警用车行为数据;因为黑车与合法运营出租车有相似的轨迹行为特征,而典型私家车和警用车与黑车在行为轨迹上特征相差较大,因此将合法运营出租车的行为数据作为正向样本、典型私家车和警用车的行为数据作为负向样本训练分类器模型;步骤5、提取步骤4中选择的样本车辆的时空特征数据,该时空特征数据包括车辆分别在工作日和节假日在一天当中不同时间段平均过车记录数,在各级卡口一天当中不同时间段的平均过车记录数,经过的各级卡口数等数据;步骤6、利用步骤5得到的样本车辆时空特征数据,采用分类算法训练黑车分类器模型,利用该分类器模型能够对所需判断车辆进行判别并返回车辆是否属于黑车;步骤7、将步骤3中产生的嫌疑黑车列表中的所有嫌疑黑车特征数据作为测试集输入步骤六中训练的分类器模型进行分类判定,获取最终模型得到的黑车列表。...

【技术特征摘要】
1.一种基于车辆轨迹时空特征分析的黑车智能发现方法,其特征在于实现步骤如下:步骤1、提取城市小型车车辆列表,并剔除合法运营出租车;步骤2、对于特定排查期,提取步骤1车辆列表中所有车辆在排查期的卡口过车记录数据;步骤3、从步骤2的过车记录数据中初步筛选得出嫌疑黑车列表,所述的嫌疑黑车的判断条件为:在该排查期内,超过R天的行为数据满足以下条件:(1)当日产生的卡口过车记录数大于设定第一阈值m;(2)当日经过的卡口个数大于设定第二阈值n;如果某辆车辆,有超过R天满足以上条件,则将其作为嫌疑黑车供后续模型进一步判断,依此筛选出所有嫌疑黑车列表,作为步骤4中黑车判断模型输入;步骤4、数据挖掘分析样本选择;所述的数据挖掘分析样本包括正向样本和负向样本:正向样本为所有在册合法运营出租车行为数据,负向样本为典型私家车、警用车行为数据;因为黑车与合法运营出租车有相似的轨迹行为特征,而典型私家车和警用车与黑车在行为轨迹上特征相差较大,因此将合法运营出租车的行为数据作为正向样本、典型私家车和警用车的行为数据作为负向样本训练分类器模型;步骤5、提取步骤4中选择的样本车辆的时空特征数据,该时空特征数据包括车辆分别在工作日和节假日在一天当中不同时间段平均过车记录数,在各级卡口一天当中不同时间段的平均过车记录数,经过的各级卡口数等数据;步骤6、利用步骤5得到的样本车辆时空特征数据,采用分类算法训练黑车分类器模型,利用该分类器模型能够对所需判断车辆进行判别并返回车辆是否属于黑车;步骤7、将步骤3中产生的嫌疑黑车列表中的所有嫌疑黑车特征数据作为测试集输入步骤六中训练的分类器模型进行分类判定,获取最终模型得到的黑车列表;所述步骤5中提取车辆时空特征数据的具体步骤如下:步骤5.1、提取车辆初始的时空特征数据,将该时空特征数据形式化描述为F={f1,f2,...,fs},其中s表示特征个数;步骤5.2、特征细化,对所述步骤5.1中的s个特征F={f1,f2,...,fs},根据特征取值的分布情况,按照特征值相近的聚类原则;所述根据特征取值的分布情况是指特征取值大小的分布,进行聚类,将相近的值归为相同类,进一步离散化,转化为特征相似性越容易判断的更细粒度的特征集合FN={f1,f2,...,fq}。2.根据权利要求1所述的基于车辆...

【专利技术属性】
技术研发人员:袁伟闫碧莹邓攀陈峰李玉成
申请(专利权)人:中国科学院软件研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1