一种轻量化的汽车尾灯灯语实时识别方法技术

技术编号:37602744 阅读:74 留言:0更新日期:2023-05-18 11:53
本发明专利技术公开了一种轻量化的汽车尾灯灯语实时识别方法,包括以下步骤:设计MCA

【技术实现步骤摘要】
一种轻量化的汽车尾灯灯语实时识别方法


[0001]本专利技术涉及自动驾驶领域,具体涉及到一种轻量化的汽车尾灯灯语实时识别方法。

技术介绍

[0002]随着汽车自动驾驶技术与智能网联技术的发展,智能车辆己经成为车辆工程领域研究的热点。当智能车辆行驶在复杂的交通场景中,智能车辆需要尽可能多地搜集周边环境的信息,从而帮助车辆安全行驶。车辆尾灯是前方车辆一个非常重要的特征,包含着极其丰富的语义信息,当刹车灯亮起时表明前车正在减速,警示后车及时采取相应的措施,有利于智能车辆的安全行驶。
[0003]现有技术中关于车辆尾灯状态识别的方法多数采用边缘提取或是颜色阈值分割,车辆尾灯目标小,边缘提取定位难且难以提取完整的边缘信息,不利于尾灯的识别;颜色阈值分割又容易受到环境光线以及天气的干扰,稳定性不好。目前,也有方案将深度学习引入车辆尾灯状态识别,例如:一种识别前方车辆尾灯及判断其状态的方法(专利申请号:201710443283.0),通过两个YOLO神经网络检测出尾灯的位置,每间隔一定帧获取尾灯的HSV值,将相邻两次的HSV差值与阈值比较判断出尾灯的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种轻量化的汽车尾灯灯语实时识别方法,其特征在于:包括以下步骤:A、设计MCA

YOLOv5s网络获取车辆尾部检测框的信息和置信度A1、对交通场景里的车辆尾部进行标记:通过公开数据集或行车记录仪获取车辆尾部检测数据集,对交通场景里的车辆尾部以YOLO格式进行标记,在YOLO格式下,每张图片对应一个文本文件,所述文本文件的每一行对应一个车辆尾部的信息,每行包括5个数字,第一个数字代表目标类别,第二个数字代表车辆尾部图像中心横坐标与图像宽度比值,第三个数字代表车辆尾部图像中心纵坐标与图像高度比值,第四个数字代表车辆尾部矩形框的宽度与图像宽度比值,第五个数字代表车辆尾部矩形框的高度与图像高度比值,相邻数字以空格分开;A2、建立MCA

YOLOv5s网络:对YOLOv5s网络进行改进,所述YOLOv5s网络是一种单阶段的目标检测网络,包括主干网络、瓶颈网络和预测网络,所述主干网络由特征提取网络和空间金字塔池化结构组成、瓶颈网络由特征金字塔网络和C3结构组成、预测网络由普通卷积层组成;其中,C3结构由3个卷积层组成;将YOLOv5s网络里的主干网络替换为11个cneck模块,最后将所有C3结构替换为深度可分离卷积并最终得到MCA

YOLOv5s网络;所述MCA

YOLOv5s网络为基于坐标注意力和倒残差结构的YOLOv5s网络;所述cneck模块为倒残差结构模块;A3、将车辆尾部检测数据集进行训练:将车辆尾部检测数据集按照a:b的比例分为训练集和验证集输入到MCA

YOLOv5s网络中进行训练;所述训练集用于对MCA

YOLOv5s网络进行训练,所述验证集用于对训练结果进行反馈,将在验证集上表现最好的权重文件保存下来用于获取车辆尾部检测框信息和置信度;A4、使用深度可分离卷积结构降低网络参数量:将步骤A2中的深度可分离卷积分为逐通道卷积和逐点卷积;在逐通道卷积中,MCA

YOLOv5s网络中经过拼接后的特征图的一个通道只与一个卷积核进行卷积操作从而得到新的特征图;逐点卷积将逐通道卷积得到的新的特征图在深度方向上进行加权组合生成最终的特征图;A5、使用cneck模块结构降低网络参数量:将步骤A2中的cneck模块首先通过1
×
1的卷积对输入的特征图进行升维,然后使用3
×
3的卷积对升维后的特征图进行逐通道深度卷积操作,利用坐标注意力模块获取输入特征图的通道信息和位置信息,再经过1
×
1卷积对特征图进行降维,最后进行残差跳跃连接以缓解随着网络不断加深出现的梯度弥散现象;A6、使用坐标注意力模块结构增强网络特征提取能力:将步骤A5中的坐标注意力模块分别在X方向和Y方向进行全局平均池化,保留两个方向通道注意力的长距离依赖关系,然后将两个方向的信息进行拼接并进行卷积操作,使两个方向的信息进行交互;在此基础上将特征图拆开分别进行卷积操作,同时关注特征图的X方向和Y方向的信息从而获取特征图的位置信息,相关公式如下:的位置信息,相关公式如下:
f=δ(F1([z
h
,z
w
]))g
h
=σ(F
h
(f
h
))g
w
=σ(F
w
(f
w
))式中,zc为全局平均池化,和分别为高度为h和宽度为w的第c通道的输出,f为经过卷积变换后的特征,g
h
为特征图沿X方向经过卷积变换后的特征,g
w
为特征图沿Y方向经过卷积变换后的特征,y
c
(i,j)为输入特征图第c通道第i行j列的值经过坐标注意力模块的输出,H、W分别为特征图的宽和高,σ和δ为激活函数,x
c
(i,j)为输入特征图第c通道第i行j列的值,x
c
(h,i)为输入特征图第c通道第h行i列的值,x
c
(j,w)为输入特征图第c通道第j行w列的值,z
h
和z
w
分别为h方向和W方向特征图进行平均池化的输出,F1、F
h
、F
w
均为1
×
1的卷积,和分别为第c通道特征图沿X方向和Y方向经过卷积变换后的特征;A7、获取车辆尾部检测框的信息和置信度:将车载视角里的交通场景使用经过训练的MCA

YOLOv5s网络进行检测,得到车辆尾部检测框的信息和置信度;B、通过Bytetrack模块获得车辆尾部图像的跟踪序列将步骤A获得的车辆尾部检测框的信息和置信度输入到Bytetrack模块获得车辆尾部图像的跟踪序列;Bytetrack模块输入为前一帧车辆尾部图像所在位置经过卡尔曼滤波后得到的预测框和当前帧的检测框,将检测框按照阈值分为高分检测框和低分检测框;所述Bytetrack模块的计算方法包括以下步骤:B1、将高分检测框和前一帧车辆尾部图像所在位置经过卡尔曼滤波后得到的预测框进行外观特征匹配或IoU匹配,最终得到成功匹配的轨迹、未匹配的轨迹和未匹配的检测框,未匹配的检测框则生成新的跟踪框;所述IoU匹配即重叠度匹配;...

【专利技术属性】
技术研发人员:连静顾汤鹏李琳辉赵剑
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1