卡口抓拍图像车辆检测方法、计算机存储介质及电子设备技术

技术编号:24093391 阅读:87 留言:0更新日期:2020-05-09 09:07
本发明专利技术提供了一种卡口抓拍图像车辆检测方法、计算机存储介质及电子设备,方法包括以下步骤:S1、获取卡口抓拍的图像;S2、对卡口抓拍的图像进行识别,并采用车身检测模型对识别到的车辆进行车身检测以检测出车身区域;S3、建立过滤规则,筛选并过滤掉不完整车身的图像信息,得到完整的车身区域;S4、采用车身前后拍分类模型对完整的车身区域进行分类;S5、输出完整的车辆信息。根据本发明专利技术实施例的卡口抓拍图像车辆检测方法,通过对现有的车辆检测方案进行优化,改变SSD中检测和分类同时进行的端到端的做法,将检测和分类分步完成,即将原有的检测分类同时进行改为先检测,再分类,可大幅提高车辆的检出率,精确率并实现模型的轻量化。

Vehicle detection method, computer storage medium and electronic equipment of image captured by bayonet

【技术实现步骤摘要】
卡口抓拍图像车辆检测方法、计算机存储介质及电子设备
本专利技术涉及车辆检测领域,更具体地,涉及一种卡口抓拍图像车辆检测方法、计算机存储介质及电子设备。
技术介绍
卡口抓拍图像中的车辆检测是车辆视频监控系统的关键环节,利用检测装置在图像中快速准确地检测出车辆目标,对后续的车辆属性分析和识别非常重要,也极大地影响着系统的处理性能。检出率即图像中被检出的目标数占全部待检目标总数的比例,这个指标越接近1,代表着越多的目标被检出,极少的目标被漏检,意味着车辆视频监控系统输出的结果更真实可靠。因此,一个具有高检出率和高精确率的车辆检测方案对于完善和增强道路车辆视频监控系统的功能和性能至关重要。近年来,随着计算机算力的提高和深度学习理论与方法的推广应用,涌现出一大批基于深度神经网络的端到端的目标检测模型,例如YOLO、SSD、MobileNetSSD、TinyDSOD等。其中,YOLO算法的精确率在众多算法中居于首位,但是其计算速度太慢,难以在工程中应用;SSD及其改进算法因其较高的检测精度和较快的检测速度被广泛应用于工业界的目标检测任务中,但是不可置否的是SSD算法的模型参数规模大,模型大小高达100多兆,在GTX1080上的检测速度也有25毫秒之多,这样的效率难以达到实际应用的需求的;MobileNet是近两年提出的轻量化深度神经网络的代表,因为采用了深度可分离卷积,大幅降低了模型参数规模,提高了运算速度,满足了相当一部分轻量化应用的需求。TinyDSOD是将DenseBlock、深度可分离卷积和特征金字塔思想融合起来的深度神经网络,因其速度快正在逐步应用于轻量化的前端检测装置中,但是该网络过度注重速度,模型太小,导致其特征提取能力受限,检测精确度有待进一步提升。深度神经网络模型以其强大的特征提取能力,在海量的数据支持下,可以实现端到端的目标检测,即检测出目标的同时得到目标的类别。以卡口抓拍图像中的车辆检测为例,现有的方案往往包括以下四步:第一步:对待检目标进行分类,例如分为前拍车身、后拍车身(后续的车辆属性分析多是在前拍车身或后拍车身上进行的);第二步:收集不同场景不同卡口摄像机的抓拍图像,并对其中的目标按照类别进行标注;第三步:利用标注好的数据训练一个深度神经网络模型;第四步:将已训练好的模型部署到视频分析系统中,实现对卡口抓拍图像中的车辆的检测。在上述技术方案中,深度神经网络模型的选择是关键。近来,TinyDSOD模型以其良好的性能表现开始工程化应用。TinyDSOD基于主干网络和特征金字塔的思想,将DenseNet中的DenseBlock作为主干网络的基础构件,同时将DenseBlock中的卷积操作替换为深度可分离卷积,在保证网络提取能力的同时,提高检测速度。此外,TinyDSOD中还引入了特征融合的思想,将高层特征向上与邻近的低层特征进行融合,从而提高小目标的检测能力,TinyDSOD的主干网络结构如表1所示。表1TinyDSOD网络结构其中的DDB-b如图1所示。现有技术通常存在以下缺点:(1)待检类别划分不合理,类内差异大,类间差异小,削弱了深度神经网络的学习能力。如图2和图3所示,公交车的前拍车身和后拍车身差异很小,但它们属于两个类别,大货车的后拍车身和小轿车的后拍车身差异很大,但它们是一个类别。这样的分类方式,导致某些不同类的对象差异太小,或者同一类的对象差异太大,这是目前车辆检测出现误检的重要原因。(2)待检目标特征复杂,增加类别会导致模型难以轻量化。除特种车辆外,目前已知的在道路上行驶的车辆类型多达十余种,例如小轿车、SUV、面包车、皮卡、小客车、大客车、小货车、大货车等。如果将待检目标类别划分的很细,例如按照车型来划分,就需要特征提取能力更强的神经网络模型,这种设计理念和工程上要求的轻量化是互相矛盾的,从实际经验来看,模型的检测能力和时效性很难平衡。
技术实现思路
有鉴于此,本专利技术提供一种卡口抓拍图像车辆检测方法、计算机存储介质及电子设备,提高了检测精度和检测效率。为解决上述技术问题,一方面,本专利技术提供一种卡口抓拍图像车辆检测方法,包括以下步骤:S1、获取卡口抓拍的图像;S2、对卡口抓拍的图像进行识别,并采用车身检测模型对识别到的车辆进行车身检测以检测出车身区域;S3、建立过滤规则,筛选并过滤掉不完整车身的图像信息,得到完整的车身区域;S4、采用车身前后拍分类模型对完整的车身区域进行分类;S5、输出完整的车辆信息。根据本专利技术实施例的卡口抓拍图像车辆检测方法,通过对现有的车辆检测方案进行优化,改变SSD中检测和分类同时进行的端到端的做法,将检测和分类分步完成,即将原有的检测分类同时进行改为先检测,再分类,可大幅提高车辆的检出率,精确率并实现模型的轻量化。根据本专利技术的一些实施例,在步骤S2中,所述车身检测模型的检测网络包括进行特征提取的Extractor模块,所述Extractor模块包括4个DenseBlock,每一个所述DenseBlock由DDB-b-plus模块构成,所述每一个DenseBlock以TranslationLayer进行连接,所述TranslationLayer由一个卷积操作和一个池化层构成。根据本专利技术的一些实施例,在步骤S2中,所述检测网络还包括进行特征提取的Extractor模块,所述Extractor模块包括4个DenseBlock,每一个所述DenseBlock由DDB-b-plus模块构成,不同的所述DenseBlock以TranslationLayer连接,所述TranslationLayer由一个卷积操作和一个池化层构成。根据本专利技术的一些实施例,在步骤S2中,采用SSD中的损失函数进行特征提取,损失函数L为分类置信度损失和位置损失之和,如式(1)所示:其中:N是与实际的物体匹配的锚点框的个数;Lconf(z,c)为分类置信度损失,Lloc(z,l,g)是锚点框的位置损失;z为锚点框与不同类别的参照物体框的匹配结果;c为预测物体框的置信度;l为预测物体框的位置信息;g为实际的物体的标注框的位置信息;α为权衡置信度损失和位置损失的参数。根据本专利技术的一些实施例,在所述检测网络中,与特征金字塔输出的6个特征图对应的锚点框的数量为6,锚点框的宽高比包含1、2、3、1/2和1/3。根据本专利技术的一些实施例,在步骤S3中,所述过滤规则包括:若目标框的高小于图像高的10%,则删除该目标;若目标框的宽高比大于1.5,则删除该目标;若两个目标框存在重叠区域,且重叠区域面积大于该目标总面积的20%,则删掉该目标。根据本专利技术的一些实施例,所述过滤规则还包括:假设图像左上角坐标(0,0),左下角(0,h),右上角(w,0),右下角(w,h),宽w,高h,目标框的坐标分别为:左上角(x1,y1),左下角(x1,y2),右上角(x2,y1),右下角(x2,y2):若x1<5,则删掉左边缘目标;若y2<0.3*h,则删掉上三分之一区域内的目标;若w-x2<本文档来自技高网
...

【技术保护点】
1.一种卡口抓拍图像车辆检测方法,其特征在于,包括以下步骤:/nS1、获取卡口抓拍的图像;/nS2、对卡口抓拍的图像进行识别,并采用车身检测模型对识别到的车辆进行车身检测以检测出车身区域;/nS3、建立过滤规则,筛选并过滤掉不完整车身的图像信息,得到完整的车身区域;/nS4、采用车身前后拍分类模型对完整的车身区域进行分类;/nS5、输出完整的车辆信息。/n

【技术特征摘要】
1.一种卡口抓拍图像车辆检测方法,其特征在于,包括以下步骤:
S1、获取卡口抓拍的图像;
S2、对卡口抓拍的图像进行识别,并采用车身检测模型对识别到的车辆进行车身检测以检测出车身区域;
S3、建立过滤规则,筛选并过滤掉不完整车身的图像信息,得到完整的车身区域;
S4、采用车身前后拍分类模型对完整的车身区域进行分类;
S5、输出完整的车辆信息。


2.根据权利要求1所述的方法,其特征在于,在步骤S2中,所述车身检测模型的检测网络包括进行特征提取的Extractor模块,所述Extractor模块包括4个DenseBlock,每一个所述DenseBlock由DDB-b-plus模块构成,所述每一个DenseBlock以TranslationLayer进行连接,所述TranslationLayer由一个卷积操作和一个池化层构成。


3.根据权利要求2所述的方法,其特征在于,在步骤S2中,所述检测网络还包括进行特征提取的Extractor模块,所述Extractor模块包括4个DenseBlock,每一个所述DenseBlock由DDB-b-plus模块构成,不同的所述DenseBlock以TranslationLayer连接,所述TranslationLayer由一个卷积操作和一个池化层构成。


4.根据权利要求1所述的方法,其特征在于,在步骤S2中,采用SSD中的损失函数进行特征提取,损失函数L为分类置信度损失和位置损失之和,如式(1)所示:



其中:N是与实际的物体匹配的锚点框的个数;Lconf(z,c)为分类置信度损失,Lloc(z,l,g)是锚点框的位置损失;z为锚点框与不同类别的参照物体框的匹配结果;c为预测物体框的置信度;l为预测物体框的位置信息;g为实...

【专利技术属性】
技术研发人员:王祥雪贺迪龙林焕凯汪刚刘双广
申请(专利权)人:高新兴科技集团股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1