当前位置: 首页 > 专利查询>暨南大学专利>正文

基于YOLOv5和MobileNetV2的车辆型号识别方法技术

技术编号:31162001 阅读:25 留言:0更新日期:2021-12-04 10:31
本发明专利技术公开了基于YOLOv5和MobileNetV2的车辆型号识别方法,包括以下步骤:S1、获取含车辆型号标签的公开车辆图片数据集;S2、对图片数据集按YOLOv5方式打标签;S3、为图片进行预处理;S4、进行YOLOv5训练,反复优化得到模型参数;S5、对原始图片数据集按YOLOv5标签的锚框数据进行裁剪,尽可能裁剪至图片仅含车辆信息;S6、修改MobileNetV2模型,拼接训练好的YOLOv5模型和修改后的MobileNetV2模型;S7、使用标签为车辆型号的原始数据集,预处理后对新拼接得到的模型进行训练,反复优化提升模型性能,得到优化训练完成的识别模型并将其用于实际车辆型号识别。本发明专利技术方法解决现有模型识别速率低,不足以满足交通系统的实时性、高效性以及在条件受限的情况下识别的准确率偏低的问题。问题。问题。

【技术实现步骤摘要】
基于YOLOv5和MobileNetV2的车辆型号识别方法


[0001]本专利技术属于计算机视觉
,具体涉及一种基于YOLOv5和MobileNetV2的车辆型号识别方法。

技术介绍

[0002]在交通领域,随着城市建设和人们的消费水平提高,城市街道状况越来越复杂,道路上车辆越来越多,因此很多问题也接踵而至——交通事故、道路障碍、乘车抢劫、车辆拥堵等等。这些状况如果都依靠交警人工监控是非常耗时费力的,构建智能化的交通系统是现在城市交通发展的趋势。目前已经出现了很多智能交通系统,它们可以进行交通监控、事故预防、交通拥堵预防和通行税征收等工作。由于监控相机和监控录像采集到的海量数据由人工进行分析处理效率低下无法做到实时性且容易出错,智能监控要求系统能够尽量减少人工操作环节,自动完成车辆的检测以及各类感兴趣内容(如类别、颜色、品牌)的识别和判断,对道路交通中发生的各类情况及时做出响应。利用计算机视觉技术能够高效地捕捉到有用的信息并进行实时处理。因此,计算机视觉技术非常适用于智能交通系统建设。
[0003]目标检测的传统方法包括级联分类器本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于YOLOv5和MobileNetV2的车辆型号识别方法,其特征在于,包括以下步骤:S1、获取含车辆型号标签的公开车辆图片数据集;S2、为图片数据集打标签,标签为锚框,锚框包括车辆车身整体,边沿距离车身设10像素空隙;S3、对图片进行预处理;S4、进行YOLOv5训练,反复优化得到模型参数;S5、对图片数据集按标签的锚框进行裁剪,裁剪至图片仅含车辆信息;S6、修改MobileNetV2模型,拼接训练好的YOLOv5模型和修改后的MobileNetV2模型;S7、使用步骤S1中获取的公开车辆图片数据集,采用与步骤S3相同的预处理后对新拼接得到的模型进行训练;反复调整代价函数和优化算法参数提升模型性能,得到优化训练完成的识别模型并将其用于实际车辆型号识别。2.根据权利要求1所述的基于YOLOv5和MobileNetV2的车辆型号识别方法,其特征在于,步骤S1具体为:以品牌、系列、型号使用labelimg工具对数据集进行标注,获得xml格式的标准文件,再将每个xml文件转换为txt文件;转换后的txt文件内容包括:类别、锚框中心点坐标x、锚框中心点坐标y、锚框宽度以及锚框高度;将xml文件中记录锚框位置的实际数值xmin、xmax、ymin以及ymax,获取中心点坐标和锚框大小,将实际数值根据图片长宽归一化,将该归一化的结果保存到txt文件中,以比例形式存储,区间为[0,1]。3.根据权利要求1所述的基于YOLOv5和MobileNetV2的车辆型号识别方法,其特征在于,步骤S3中,对图片进行预处理具体为:对数据进行扩增,通过对原始图片数据集中的数据进行随机缩放、亮度调整、随机镜像、随机旋转以及噪声干扰,同时解析标注的xml文件,修改对应的锚框位置,保证增广后的数据中的标签没有出现偏移,再将xml转为对应的txt标签文件,覆盖原来的txt。4.根据权利要求1所述的基于YOLOv5和MobileNetV2的车辆型号识别方法,其特征在于,步骤S4具体为:设置训练时的各项参数,包括数据集的根目录、图片的训练集和验证集的目录、类别个数以及类别名称;进行YOLOv5模型训练;可视化训练中会显示大量参数,观察准确率Precision和召回率Recall,波动不大时训练结果较好,然后以mAP@0.5&mAP@0.5:0.95数值评价模型。5.根据权利要求1所述的基于YOLOv5和MobileNetV2的车辆型号识别方法,其特征在于,步骤S6中,修改MobileNetV2模型具体为:为满足不同大小的图片输入,在原有的MobileNetV2模型的全连接层前接入一层SPP层;然后使用经过裁剪的图片数据集对修改过的MobileNetV2进行训练,反复优化获取模型参数;MobileNetV2的训练过程具体为:将图片输入到模型中得到计算结果,将该结果与标签进行代价函数运算获取可以表示
预测误差的代价,再根据代价使用优化算法优化模型参数,以使下轮...

【专利技术属性】
技术研发人员:戚自华钟建强李志颖赖浩天刘启霄黄斐然吴永东
申请(专利权)人:暨南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1