基于离群点分析算法的套牌车快速甄别方法技术

技术编号:15022251 阅读:69 留言:0更新日期:2017-04-05 00:04
本发明专利技术属于套牌车快速辨析技术领域,具体涉及一种基于离群点分析算法的套牌车快速甄别方法。本发明专利技术包括以下步骤:建立套牌车样本的车牌号集合;检索出各样本车辆的过车数据;对检索出来的过车数据进行数据预处理;4)、采用离群点分析算法对上述数据预处理后的过车数据进行分析;获得参考速度值作为基准值输入套牌车辨识系统,进行套牌车辨识。本发明专利技术利用“同一辆车在一定的时间范围内,不可能在两个不同地点都出行过”的原理,通过求得套牌车的参考速度值,并以此来快速辨识套牌车,不受车辆外观影响,具有很强的实用性。

【技术实现步骤摘要】

本专利技术属于套牌车快速辨析
,具体涉及一种基于离群点分析算法的套牌车快速甄别方法
技术介绍
套牌车是指未在交管部门办理牌照领取手续,伪造、冒用他人的合法车牌和行驶执照,以逃避违章、肇事和交纳相关费用责任的车辆。套牌车的存在不仅严重侵害合法车主利益、破坏交通安全管理秩序,而且造成国家税费大量流失,更可能被不法分子用来从事飙车、抢劫和贩毒等违法犯罪活动。由于套牌车具有很强的隐蔽性,给警方侦破案件增加了难度,给人们的日常生活带来诸多不安全因素,严重扰乱了社会治安。目前对套牌车应对方法大多停留在人工排查、他人举报等阶段,耗时耗力却收效甚微,致使套牌车屡禁不止、愈演愈烈,故研究一种高效率、自动化、易推广的套牌车检测方法已迫在眉睫。随着计算机和通信技术的发展,研发人员已经设计出了一些套牌车识别方案;其中基于RFID技术的套牌车检测方法可在一定程度上解决套牌车问题。该方法需在车辆上安装不可拆卸且具备唯一身份的电子标签读写器,利用在值勤岗哨或者公安卡口上对应的读取设备进行信息读取,从而进行相应车牌的辨识效果。上述方式显然对于投入成本的要求过高,难以快速推广。
技术实现思路
本专利技术的目的为克服上述现有技术的不足,提供一种更为高效快捷的基于离群点分析算法的套牌车快速甄别方法;其利用“同一辆车在一定的时间范围内,不可能在两个不同地点都出行过”的原理,通过求得套牌车的参考速度值,并以此来快速辨识套牌车,不受车辆外观影响,具有很强的实用性。为实现上述目的,本专利技术采用了以下技术方案:一种基于离群点分析算法的套牌车快速甄别方法,其特征在于包括以下步骤:1)、选取套牌车样本,建立套牌车样本的车牌号集合;2)、根据套牌车样本车牌号,在大数据平台上检索出各样本车辆的过车数据;3)、对检索出来的过车数据进行数据预处理,包括数据清洗、特征转换、归一化处理,之后进入下一步骤;4)、采用离群点分析算法对上述数据预处理后的过车数据进行分析,具体包括:4a、对于经过3)步骤预处理之后的数据,计算每辆套牌车样本的每条过车数据与该辆车其他所有过车数据的欧几里得距离;4b、对上述的欧几里得距离按从小到大的顺序进行排序,计算该条过车数据的第k距离和第k领域,进而得到该过车数据所对应的可达距离;4c、计算每条过车数据第k领域内所有过车数据可达距离的平均值,得到该辆车各过车数据的可达密度;4d、由过车数据的可达密度,获得所有过车数据的局部离群点因子。4e、将所有过车数据的局部离群点因子按从大到小的顺序进行排序,根据各局部离群点因子所对应的该车辆经纬度坐标和时间值,通过速度计算公式,获得作为套牌车的所有车辆的各速度值;以上述各速度值中的最小值为套牌车的参考速度值;5)、将上述参考速度值作为基准值输入套牌车辨识系统;当需辨识车辆在不同经纬度坐标的任意两点出现,根据该两点出现的时间值差异而计算出该需辨识车辆的平均行驶速度,此时套牌车辨识系统进行以下判断并获得判定结果:当该需辨识车辆的平均行驶速度大于或等于上述参考速度值时,该车辆车牌号为套牌,可通知相应部门处理;当该需辨识车辆的平均行驶速度小于上述参考速度值时,该车辆为普通车辆。2、所述步骤1)中,套牌车样本包括黄牌车和蓝牌车;从卡口系统中查询出黄牌与蓝牌号码相同的车牌号码集合作为套牌车样本车辆集合。3、所诉步骤2)中,将套牌车样本车牌号集合输入HBase数据库中进行过车数据检索,并通过MapReduce获取存储在HBase数据库中的数据。4、所述步骤3)中,所述数据清洗步骤为:将非结构化的数据的格式进行标准化处理,并将有缺失或者错误的数据删除;所述特征转换步骤为:将非数字型特征属性值转换为数字型特征属性值,该非数字型特征属性值至少包括某车辆经过某卡口所对应的时间和该卡口编号。所述步骤4b中,将车辆某条过车数据与其他过车数据的欧几里得距离按从小到大的顺序进行排序后,取第k个值作为该过车数据的第k距离,以此过车数据为中心,以第k距离值为半径的空间区域为该过车数据的第k领域。所述步骤4c中,将某条过车数据与第k领域中其他过车数据的欧几里得距离,同他们各自的第k距离比较,取比较后的最大值作为第k领域内该条过车数据所对应的可达距离;通过求得每条过车数据第k领域内所有过车数据可达距离的平均值,对此平均值求倒数,即得到各过车数据的可达密度。所述步骤4d中,通过计算得到某条过车数据第k领域内所有过车数据可达密度与该条过车数据的可达密度之比,获得所有比值的平均值;对该平均值求倒数,即得到各过车数据的局部离群因子;具体计算公式为:LOF(p)=Σs∈N(p)ρ(s)ρ(p)|N(p)|]]>其中:LOF(p)为p点的局部离群因子,s为属于p点第k领域的点,ρ(s)为s点的可达密度值,ρ(p)为p点的可达密度值,N(p)为p点的第k领域。将所有过车数据的局部离群因子大于所设定的基准阈值的过车数据按离群因子从大到小的顺序排列,这些点即为所要求得的局部离群点因子,所述基准阈值的取值范围0.8至0.9。本专利技术的有益效果在于:1)、有别于传统的必须主动安装相应不可拆卸且价格高昂的电子标签读写器所带来的诸多缺陷,本专利技术首先确定套牌车样本车牌号集合,根据套牌车样本车牌号,在大数据平台上检索出样本车辆的过车数据,然后对检索出来的过车数据进行数据预处理;然后将数据预处理后的过车数据采用离群点分析算法进行挖掘分析,并对结果进行统计分析,确定套牌车识别系统的参考速度值,最终将该值传送给套牌车识别系统进行相应辨识。上述整个分析过程自发进行,最大限度的减少了人为因素对最终参考速度值确定的影响。同时,由于本专利技术将非套牌车与套牌车速度分界值作为套牌车的参考速度值,大大的提升了套牌车识别系统的识别精度和识别速度,其实用性极高。附图说明图1为套牌车参考速度值的获取流程图;图2为本专利技术的数据预处理流程图;图3为本专利技术的离群点分析方法流程图。具体实施方式为便于理解,此处结合附图1-3对本专利技术的具体工作流程作以下描述:实际上,本专利技术的核心部分,是基于“同一辆车在一定的时间范围内,不可能在两个不同地点都出行过”的原理来保证的。通过卡口系统,极端情况下,如果同一时间在不同经纬度本文档来自技高网...

【技术保护点】
一种基于离群点分析算法的套牌车快速甄别方法,其特征在于包括以下步骤:1)、选取套牌车样本,建立套牌车样本的车牌号集合;2)、根据套牌车样本车牌号,在大数据平台上检索出各样本车辆的过车数据;3)、对检索出来的过车数据进行数据预处理,包括数据清洗、特征转换、归一化处理,之后进入下一步骤;4)、采用离群点分析算法对上述数据预处理后的过车数据进行分析,具体包括:4a、对于经过3)步骤预处理之后的数据,计算每辆套牌车样本的每条过车数据与该辆车其他所有过车数据的欧几里得距离;4b、对上述的欧几里得距离按从小到大的顺序进行排序,计算该条过车数据的第k距离和第k领域,进而得到该过车数据所对应的可达距离;4c、计算每条过车数据第k领域内所有过车数据可达距离的平均值,得到该辆车各过车数据的可达密度;4d、由过车数据的可达密度,获得所有过车数据的局部离群点因子;4e、将所有过车数据的局部离群点因子按从大到小的顺序进行排序,根据各局部离群点因子所对应的该车辆经纬度坐标和时间值,通过速度计算公式,获得作为套牌车的所有车辆的各速度值;以上述各速度值中的最小值为套牌车的参考速度值;5)、将上述参考速度值作为基准值输入套牌车辨识系统;当需辨识车辆在不同经纬度坐标的任意两点出现,根据该两点出现的时间值差异而计算出该需辨识车辆的平均行驶速度,此时套牌车辨识系统进行以下判断并获得判定结果:当该需辨识车辆的平均行驶速度大于或等于上述参考速度值时,该车辆车牌号为套牌,可通知相应部门处理;当该需辨识车辆的平均行驶速度小于上述参考速度值时,该车辆为普通车辆。...

【技术特征摘要】
1.一种基于离群点分析算法的套牌车快速甄别方法,其特征在于
包括以下步骤:
1)、选取套牌车样本,建立套牌车样本的车牌号集合;
2)、根据套牌车样本车牌号,在大数据平台上检索出各样本车辆的
过车数据;
3)、对检索出来的过车数据进行数据预处理,包括数据清洗、特征
转换、归一化处理,之后进入下一步骤;
4)、采用离群点分析算法对上述数据预处理后的过车数据进行分
析,具体包括:
4a、对于经过3)步骤预处理之后的数据,计算每辆套牌车样本的
每条过车数据与该辆车其他所有过车数据的欧几里得距离;
4b、对上述的欧几里得距离按从小到大的顺序进行排序,计算该条
过车数据的第k距离和第k领域,进而得到该过车数据所对应的可达距
离;
4c、计算每条过车数据第k领域内所有过车数据可达距离的平均值,
得到该辆车各过车数据的可达密度;
4d、由过车数据的可达密度,获得所有过车数据的局部离群点因子;
4e、将所有过车数据的局部离群点因子按从大到小的顺序进行排
序,根据各局部离群点因子所对应的该车辆经纬度坐标和时间值,通过
速度计算公式,获得作为套牌车的所有车辆的各速度值;以上述各速度
值中的最小值为套牌车的参考速度值;
5)、将上述参考速度值作为基准值输入套牌车辨识系统;当需辨识
车辆在不同经纬度坐标的任意两点出现,根据该两点出现的时间值差异
而计算出该需辨识车辆的平均行驶速度,此时套牌车辨识系统进行以下
判断并获得判定结果:
当该需辨识车辆的平均行驶速度大于或等于上述参考速度值时,该
车辆车牌号为套牌,可通知相应部门处理;
当该需辨识车辆的平均行驶速度小于上述参考速度值时,该车辆为
普通车辆。
2.根据权利要求1所述的一种基于离群点分析算法的套牌车快速
甄别方法,其特征在于:所述步骤1)中,套牌车样本包括黄牌车和蓝
牌车;从卡口系统中查询出黄牌与蓝牌号码相同的车牌号码集合作为套
牌车样本车辆集合。
3.根据权利要求1所述的一种基于离群点分析算法的套牌车快速
甄别方法,其特征在于:所诉步骤2)中,将套牌车样本车牌号集合输

【专利技术属性】
技术研发人员:马韵洁刘畅张凯吴艳平罗晶晶朱萍
申请(专利权)人:安徽四创电子股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1