车辆公告号数据采集和分类的系统及方法技术方案

技术编号:16663246 阅读:46 留言:0更新日期:2017-11-30 12:08
本发明专利技术提供了一种车辆公告号数据采集和分类的系统及方法,包括采集部分和分类部分,且所述的分类部分与采集部分相连接,其中,所述的采集部分用以构建车辆公告号信息列表,并用以采集数据构建待分类数据库;所述的分类部分用以根据公告号信息对数据库中的数据进行训练获取分类模型,并在图像信息层面对数据进行重新分类,迭代训练和分类过程以构建车辆图像分类数据库。采用该种系统时,由于其基于车管系统中的已有信息建立起了车辆图像数据库,并根据图像信息进行重新分类,因此该车辆公告号数据采集和分类的系统可快速建立车辆图像分类数据库用于车辆识别产品的开发,避免人工数据标注。

【技术实现步骤摘要】
车辆公告号数据采集和分类的系统及方法
本专利技术涉及智能交通领域,尤其涉及智能交通车辆识别领域及相关数据库的快速建立,具体涉及一种车辆公告号数据采集和分类的系统及方法。
技术介绍
随着深度学习在分类和检测问题上的快速发展,其在交通和治安领域中的应用场景越来越多元化,应用范围现已涉及到车辆品牌识别、车牌识别、车辆类型识别(轿车、货车、客车)、颜色识别、人脸识别等。其中,车辆品牌、款系和年代识别功能不仅有助于套牌车辆筛查,而且正逐步发展成为刑侦工作中的重要技术手段,即根据车辆品牌和款系在海量视频和图像数据中查找和检索嫌疑车辆,其效率已远远高于以往的人海战术。然而,在实际产品研发过程中,为实现车辆品牌、款系和年代识别功能往往不可避免的需要面对以下三个突出问题:(1)数据需求量大。市场上常见的车辆品牌有上百种,所有品牌旗下不同型号车辆加起来有成千上万款。众所周知,数据集的数量和质量对分类训练模型具有直接影响,每种车辆的训练数据要达到上百张才能涵盖其在不同视角和光线下的不同情况。因此,总体数据量需要达到十几万甚至更多。(2)数据分布不均匀。在以往车辆品牌、款系和年代识别工作中发现,通过交通卡口或监控视频采集到的数据分布倾斜现象严重,主要体现在以下两个方面:一是在同一地区,不同品牌数据概率分布差异巨大;二是不同地域间车辆品牌数据分布也不同。(3)模型需要不断维护和更新。每年仍有新车型不断问世,需要对识别模型做定期更新。如何避免盲目的采集数据,对缺少的部分数据做针对性采集和补充成了一个亟需解决的问题。传统的数据采集方法难度大、效率低、人工标注成本高、耗时长。基于以上分析,需要一种易于实现的车辆品牌数据采集和数据处理方案。因此车辆公告号数据采集和分类系统提出一种基于车辆公告号的数据采集的方法。车辆公告号是指制造厂商对具有同类型、品牌、种类、系列及车身型式的车辆所给予的名称。车辆公告号编码的内容有五部分:企业名称代号、车辆类别代号、主要参数代号、产品序号、企业自定代号。车辆公告号所包含内容丰富且具有唯一性。通过车辆公告号作为索引来采集数据更直接和高效。另外,部分车辆公告号数据存在具有相同车脸或车尾形态结构的问题,仅从交通监控图像或视频中无法对其进行区分。这种情况在同一品牌的不同款系间更为常见。不论是在模型训练还是使用阶段,要提高识别率和用户体验就需要将这类具有相同车脸或车尾的公告号归并为一类。显然通过人工标注的方法在几千种车脸中找到相同的车脸效率低、速度慢、可信度不高。为解决这一问题,车辆公告号数据采集和分类系统针对车辆公告号数据的特点提出一种车辆公告号数据自动分类方案,实现具有相同车脸或车尾、不同公告号数据的自动高效合并。
技术实现思路
本专利技术的目的是克服上述现有技术中的缺点,提供一种用于解决现有车辆品牌、款系和年代识别产品开发过程中数据采集难度大、冗余度高、人工标注效率低、不同公告号可能具有相同车脸或车尾形态结构、且仅从图像或视频信息无法进行区分的问题的车辆公告号数据采集和分类的系统及方法,为车辆品牌、款系和年代分类和识别产品建立研发所需的训练数据库。为了实现上述目的,本专利技术的车辆公告号数据采集和分类的系统及方法具体如下:该车辆公告号数据采集和分类系统,其主要特点是,包括采集部分和分类部分,且所述的分类部分与采集部分相连接,其中,所述的采集部分用以构建车辆公告号信息列表,并用以采集数据构建待分类数据库;所述的分类部分用以根据公告号信息对数据库中的数据进行训练获取分类模型,并在图像信息层面对数据进行重新分类,迭代训练和分类过程以构建车辆图像分类数据库。较佳地,所述的采集部分包括:对应关系建立模块,用于建立车辆公告号信息列表,所述的车辆公告号信息列表包括车辆公告号和车辆公告号对应的车辆基本信息;数据采集模块,用于根据所述的车辆公告号信息列表中的车辆公告号在车管系统中采集数据,建立与该车辆公告号信息列表相匹配的数据库;所述的分类部分包括:预处理模块,用于根据车辆公告号包含的分类信息给所述的数据库中的数据分配样本标签,并按预设规则对所述的数据库中的数据进行划分,获取至少3个数据集,所述的预处理模块还用于对所述的数据库中的数据进行预处理;分类模型训练模块,用于根据分类信息对所述的数据集进行训练,获取分类训练模型;分类模型测试模块,用于根据所述的数据集,对所述的分类模型训练模块获取的分类训练模型进行测试,获取测试结果;测试结果统计模块,用于统计分类模型测试模块输出的测试结果,获取相应的测试指标;数据合并模块,用于根据所述测试指标,判定不同车辆公告号数据对应图像信息是否一致,并对图像信息一致的车辆公告号对应数据进行归类合并。更佳地,所述的车辆基本信息包括该项车辆公告号对应的车辆的品牌、款系和年代描述信息。尤佳地,所述的数据库为图像数据库,该图像数据库中的图像数据包括所述的数据采集模块采集的所述的车辆公告号信息列表中包含的车辆公告号对应的图像数据。甚佳地,图像数据包括车辆正面通过时的车头图像数据和背面驶离的车尾图像数据。甚佳地,所述的预处理模块为图像预处理模块,所述的图像预处理模块根据分类信息给所述的图像数据分配样本标签,并按预设规则将所述的图像数据划分为3个互不相交的数据集,分别为训练集、验证集和测试集,其中,所述的训练集用以进行模型训练获取分类训练模型;所述的验证集用以调整训练过程中的未成形的分类训练模型,使获取的分类训练模型符合预设条件;所述的测试集用以测试所述的分类训练模型;所述的预处理模块对所述的数据库中的数据进行预处理为所述的图像预处理模块对所述的图像数据库中的图像数据进行按需剪裁和缩放。极佳地,所述的分类模型训练模块根据所述的训练集中的图像数据的样本标签,对所述的训练集进行深度学习训练,获取卷积神经网络作为分类训练模型,且所述的分类模型训练模块还将所述的验证集中的图像数据通过未成形的分类训练模型,获取验证集中的图像数据的测试标签,并将该测试标签与所述的图像数据的样本标签进行比较,获取所述的未成形的分类训练模型对验证集中图像数据的识别率,并根据该识别率调整所述的未成形的分类训练模型中的相关权重,直至所述的未成形的分类训练模型对验证集中图像数据的识别率达到预设阈值。极佳地,所述的分类模型测试模块将所述的测试集中的图像数据输入所述的分类训练模型,获取该测试集中的图像数据的测试标签,并将该测试标签与该图像数据的样本标签进行比较,获取比较结果,所述的测试结果包括测试标签及比较结果。甚佳地,所述的测试结果统计模块中的测试指标包括:测试集识别率、单类识别率和类间交叉错误率,所述的测试指标包括测试集识别率、单类识别率和类间交叉错误率各项指标,其中,所述的测试集识别率为所述的测试集中所有被正确识别的图像数据的数量与测试集中图像数据总数量的比值;所述的单类识别率为分类训练模型对测试集中的具有某类样本标签的图像数据进行正确识别的数量与测试集中该类样本标签的图像数据的总数量的比值;所述的交叉错误率为具有某类样本标签的图像数据通过分类训练模型后被误识别为具有另一类测试标签的图像数据的概率。尤佳地,所述的车辆公告号数据采集和分类系统还具有对应关系更新模块,对应关系更新模块,用于对归类合并处理后的图像数据对应的车辆公告号信息表进行更新。以上本文档来自技高网
...
车辆公告号数据采集和分类的系统及方法

【技术保护点】
一种车辆公告号数据采集和分类系统,其特征在于,包括采集部分和分类部分,且所述的分类部分与采集部分相连接,其中,所述的采集部分用以构建车辆公告号信息列表,并用以采集数据构建待分类数据库;所述的分类部分用以根据公告号信息对数据库中的数据进行训练获取分类模型,并在图像信息层面对数据进行重新分类,迭代训练和分类过程以构建车辆图像分类数据库。

【技术特征摘要】
2017.06.15 CN 20171045092451.一种车辆公告号数据采集和分类系统,其特征在于,包括采集部分和分类部分,且所述的分类部分与采集部分相连接,其中,所述的采集部分用以构建车辆公告号信息列表,并用以采集数据构建待分类数据库;所述的分类部分用以根据公告号信息对数据库中的数据进行训练获取分类模型,并在图像信息层面对数据进行重新分类,迭代训练和分类过程以构建车辆图像分类数据库。2.根据权利要求1所述的车辆公告号数据采集和分类系统,其特征在于,所述的采集部分包括:对应关系建立模块,用于建立车辆公告号信息列表,所述的车辆公告号信息列表包括车辆公告号和车辆公告号对应的车辆基本信息;数据采集模块,用于根据所述的车辆公告号信息列表中的车辆公告号在车管系统中采集数据,建立与该车辆公告号信息列表相匹配的数据库;所述的分类部分包括:预处理模块,用于根据车辆公告号包含的分类信息给所述的数据库中的数据分配样本标签,并按预设规则对所述的数据库中的数据进行划分,获取至少3个数据集,所述的预处理模块还用于对所述的数据库中的数据进行预处理;分类模型训练模块,用于根据分类信息对所述的数据集进行训练,获取分类训练模型;分类模型测试模块,用于根据所述的数据集,对所述的分类模型训练模块获取的分类训练模型进行测试,获取测试结果;测试结果统计模块,用于统计分类模型测试模块输出的测试结果,获取相应的测试指标;数据合并模块,用于根据所述测试指标,判定不同车辆公告号数据对应图像信息是否一致,并对图像信息一致的车辆公告号对应数据进行归类合并。3.根据权利要求2所述的车辆公告号数据采集和分类系统,其特征在于,所述的车辆基本信息包括该项车辆公告号对应的车辆的品牌、款系和年代描述信息;所述的数据库为图像数据库,该图像数据库中的图像数据包括所述的数据采集模块采集的所述的车辆公告号信息列表中包含的车辆公告号对应的图像数据;所述的图像数据包括车辆正面通过时的车头图像数据和背面驶离的车尾图像数据;所述的预处理模块为图像预处理模块,所述的图像预处理模块根据分类信息给所述的图像数据分配样本标签,并按预设规则将所述的图像数据划分为3个互不相交的数据集,分别为训练集、验证集和测试集,其中,所述的训练集用以进行模型训练获取分类训练模型;所述的验证集用以调整训练过程中的未成形的分类训练模型,使获取的分类训练模型符合预设条件;所述的测试集用以测试所述的分类训练模型;所述的预处理模块对所述的数据库中的数据进行预处理为所述的图像预处理模块对所述的图像数据库中的图像数据进行按需剪裁和缩放。4.根据权利要求3所述的车辆公告号数据采集和分类系统,其特征在于,所述的分类模型训练模块根据所述的训练集中的图像数据的样本标签,对所述的训练集进行深度学习训练,获取卷积神经网络作为分类训练模型,且所述的分类模型训练模块还将所述的验证集中的图像数据通过未成形的分类训练模型,获取验证集中的图像数据的测试标签,并将该测试标签与所述的图像数据的样本标签进行比较,获取所述的未成形的分类训练模型对验证集中图像数据的识别率,并根据该识别率调整所述的未成形的分类训练模型中的相关权重,直至所述的未成形的分类训练模型对验证集中图像数据的识别率达到预设阈值;所述的分类模型测试模块将所述的测试集中的图像数据输入所述的分类训练模型,获取该测试集中的图像数据的测试标签,并将该测试标签与该图像数据的样本标签进行比较,获取比较结果,所述的测试结果包括测试标签及比较结果;所述的测试结果统计模块中的测试指标包括:测试集识别率、单类识别率和类间交叉错误率,其中,所述的测试集识别率为所述的测试集中所有被正确识别的图像数据的数量与测试集中图像数据总数量的比值;所述的单类识别率为分类训练模型对测试集中的具有某类样本标签的图像数据进行正确识别的数量与测试集中该类样本标签的图像数据的总数量的比值;所述的交叉错误率为具有某类样本标签的图像数据通过分类训练模型后被误识别为具有另一类测试标签的图像数据的概率。5.根据权利要求2所述的车辆公告号数据采集和分类系统,其特征在于,所述的车辆公告号数据采集和分类系统还具对应关系更新模块,所述的对应关系更新模块用于对归类合并处理后的图像数据对应的车辆公告号信息表进行更新。6.一种基于权利要求1至5中任一项所述的系统实现车辆公告号数据采集和分类的方法,其特征在于,所述的方法包括以下步骤:(1)所述的采集部分构建车辆公告号信息列表,并采集数据,构建数据库;(2)通过所述的分类部分对数据库中的数据进行训练和重新分类,获取分类数据库。7.根据权利要求6所述的实现车辆公告号数据采集和分类的方法,其特征在于,所述的步骤(1)通过所述的采集部分实现,其中,所述的标签与车辆公告号一一对应,所述的采集部分包括:对应关系建立模块,用于建立车辆公告号信息列表,所述的车辆公告号信息列表包括车辆公告号和车辆公告号对应的车辆基本信息;数据采集模块,用于根据所述的车辆公告号信息列表中的车辆公告号在车管系统中采集数据,建立与该车辆公告号信息列表相匹配的数据库...

【专利技术属性】
技术研发人员:赵一欣邵杰梅林吴轶轩
申请(专利权)人:公安部第三研究所
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1