一种基于卷积神经网络的车辆检测及着地点定位方法技术

技术编号:23892087 阅读:15 留言:0更新日期:2020-04-22 06:53
本发明专利技术公开了一种基于卷积神经网络的车辆检测及落地点定位方法,该方法包括:搭建针对车辆检测的神经网络,获取检测网络得到的检测框,对检测中图像计算Y轴‑像素和的直方图,平滑滤波之后最低点就是车辆的落地点。本发明专利技术采用了基于YOLOV3‑tiny改进的目标检测网络,计算量小,能够在能力较弱的嵌入式硬件平台上完成实时性的运算。加强了对中等大小车辆的检测,提高了车辆的检测精度,运用直方图的形式再次对着地点进行确认,增加了鲁棒性。

【技术实现步骤摘要】
一种基于卷积神经网络的车辆检测及着地点定位方法
本专利技术属于图像识别技术,具体涉及在嵌入式平台等计算能力较弱的硬件上完成车辆检测及着地点定位的技术。
技术介绍
车辆碰撞预警系统是智能交通体系的重要研究内容,现在受到了广泛的关注。在车载的车辆碰撞预警系统研究领域中,利用计算机视觉检测车辆并且确定车辆轮胎在地面的着地点是其中一个关键性问题。卷积网络的应用提高了车辆检测的精度,对于卷积神经网络模型,随着网络层数的增加,神经网络对图像的理解越来越丰富,目标检测识别精度越来越高,但计算量也随之增长。对于常见的嵌入式平台,基于深度学习的车辆检测算法虽然精度基本稳定,但是帧率远远达不到实时的应用要求,无法在工业上被广泛采用。YOLOV3-tiny网络是基于YOLOV3算法的一个轻量化目标检测网络,其网络层数少、参数量少,在一般的嵌入式平台上可以基本保证实时运算。但YOLOV3-tiny对中等距离的车辆检测效果不佳,对车辆检测的精确度不稳定,会出现对于相邻两帧之间的低速前进的同一车辆的检测框相差较大,无法直接利用检测框得到车辆的着地点的问题。
技术实现思路
本专利技术所要解决的技术问题是,提供一种对图像中车辆检测和车辆着地点确定效果好的方法。本专利技术为解决采用技术方案如下:一种基于卷积神经网络的车辆检测及着地点定位方法,包括以下步骤:1)设计车辆检测网络架构:车辆检测网络包括15个卷积层、2个残差层、1个上采样层、2个物体检测层;车辆检测网络接收输入的图像为RGB三通道的彩色图片,大小为416*416;前5层卷积网络的结构与YOLOV3-tiny网络前5层卷积网络相同,对输入图像进行特征的初步提取,第5个卷积层输出的特征图为26*26*256,输出至第6个卷积层、第1个残差层;第6个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第7个卷积层、第2个残差层;第7个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第1个残差层;第1个残差层连接输入的来自第5、第7个卷积层的特征图后输出至第8个卷积层;第8个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第15个卷积层、第2个残差层;第2个残差层连接输入的来自第6、第8个卷积层的特征图后输出至第9个卷积层;第9个卷积层使用512个大小为1*1的卷积核,输出的特征图为26*26*512,输出至第10个卷积层;第10个卷积层使用512个大小为3*3的卷积核,输出的特征图为13*13*512,输出至第11个卷积层;第11个卷积层使用1024个大小为1*1的卷积核,输出的特征图为13*13*1024,输出至第12个卷积层;第12个卷积层使用256个大小为1*1的卷积核,输出的特征图为13*13*256,输出至第13、第15个卷积层;第13个卷积层使用512个大小为1*1的卷积核,输出的特征图为13*13*512,输出至物体检测层1;物体检测层1使用n个大小为1*1的卷积核,输出的特征图为13*13*n,输出至第1个物体检测深度网络,第1个物体检测深度网络在13*13这个尺度上进行位置及物体类别预测,其中n=3*(m+5),m为预设的现有车辆类别总数;第14个卷积层使用128个大小为1*1的卷积核,输出的特征图为13*13*128,输出至上采样模块;上采样模块完成上采样对输入的特征图完成上采样处理后,输出的特征图为26*26*256,与第8个卷积层8的输出相连接输出至第16个卷积层;第15个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至物体检测层2;物体检测层2使用n个大小为1*1的卷积核,输出的特征图为26*26*n,输出至第2个物体检测深度网络,第2个物体检测深度网络在26*26这个尺度上进行位置及物体类别预测;车辆检测网络得到13*13和26*26这两个尺度的预测结果之后使用非极大值抑制算法得到最终的车辆检测结果;2)将m类车辆的图片分别标记车辆位置和类型形成数据集,按3:1的比例设置训练集和验证集,完成对车辆检测网络的训练;3)车辆检测步骤:来自于车载摄像头输入的图像使用所述车辆检测网络进行车辆检测,得到图像中的车辆预选框;4)着地点定位步骤:获得车辆预选框中心,相对于车辆预选框的宽不变,高增长1.2倍,以预选框中心为中心再取候选框;取候选框底部1/6部分进行Y轴上的像素的累加计算,得到Y轴-像素和的直方图;所述直方图经过均值滤波之后,将Y轴方向上的最小值所对应在候选框中的水平线作为车辆的着地点所在的位置。申请人发现对于常用的输入图片尺寸416*416,对中等距离的车辆检测中26*26尺度非常重要。但YOLOV3-tiny对26*26这个尺度的检测比较弱,因此对中等距离的车辆检测效果不佳,加之网络层数少,对车辆检测的精确度不稳定。本专利技术采用了应量化的基于YOLOV3-tiny改进后的网络,改进后的网络注重了26*26尺度的检测,增加了卷积层和残差层,一方面提高了网络的特征提取能力,能够增加目标的检测精度,另一方面其计算量小,能够在嵌入式平台中进行实时目标检测。本专利技术提供的稳定准确的车辆检测网络为之后计算车辆的着地点提供了支撑。车辆的着地点确定是车辆检测预警的重要组成部分,本专利技术通过增加了直方图寻找车辆在地面的阴影最深的位置对着地点进行精确定位。本专利技术的有益效果是,车辆检测精度高,着地点定位快速且鲁棒性好。附图说明图1是本专利技术的流程图。图2是优化后的目标检测网络结构图。具体实施方式下面结合附图对本专利技术进行进一步说明,如图1所示,一种基于卷积神经网络的车辆检测及着地点定位方法,包括以下步骤:步骤1:确定现有车辆类别m,则最后一层滤波器的数量为n=3*(m+5)。步骤2:收集带有车辆的图片,并标记车辆在图片中的位置和类型,形成数据集。步骤3:在深度学习框架中实现如图2所示的神经网络。输入图片为RGB三通道的彩色图片,大小为416*416。使用YOLOV3-tiny前5层卷积网络,对图像进行特征的初步提取,得到特征图为26*26*256的输出。经过卷积层6、7,均采用使用256个大小为1*1的卷积核,设置步长为1,得到特征图为26*26*256的输出。经过残差层1,连接卷积层5和卷积层7的输出。经过卷积层8,采用256个大小为1*1的卷积核,设置步长为1,得到特征图为26*26*256的输出。经过残差层2,连接卷积层6和卷积层8的输出。经过卷积层9,采用512个大小为1*1的卷积核,设置步长为1,得到特征图为26*26*512的输出。经过卷积层10,采用512个大小为3*3的卷积核,设置步长为1,得到特征图为13*13*512的输出。经过卷积层11,采本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的车辆检测及着地点定位方法,其特征在于,包括以下步骤:/n1)设计车辆检测网络架构:/n车辆检测网络包括15个卷积层、2个残差层、1个上采样层、2个物体检测层;/n车辆检测网络接收输入的图像为RGB三通道的彩色图片,大小为416*416;/n前5层卷积网络的结构与YOLOV3-tiny网络前5层卷积网络相同,对输入图像进行特征的初步提取,第5个卷积层输出的特征图为26*26*256,输出至第6个卷积层、第1个残差层;/n第6个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第7个卷积层、第2个残差层;/n第7个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第1个残差层;第1个残差层连接输入的来自第5、第7个卷积层的特征图后输出至第8个卷积层;/n第8个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第15个卷积层、第2个残差层;第2个残差层连接输入的来自第6、第8个卷积层的特征图后输出至第9个卷积层;/n第9个卷积层使用512个大小为1*1的卷积核,输出的特征图为26*26*512,输出至第10个卷积层;/n第10个卷积层使用512个大小为3*3的卷积核,输出的特征图为13*13*512,输出至第11个卷积层;/n第11个卷积层使用1024个大小为1*1的卷积核,输出的特征图为13*13*1024,输出至第12个卷积层;/n第12个卷积层使用256个大小为1*1的卷积核,输出的特征图为13*13*256,输出至第13、第15个卷积层;/n第13个卷积层使用512个大小为1*1的卷积核,输出的特征图为13*13*512,输出至第1个物体检测层;/n第1个物体检测层使用n个大小为1*1的卷积核,输出的特征图为13*13*n,输出至第1个物体检测深度网络,第1个物体检测深度网络在13*13这个尺度上进行位置及物体类别预测,其中n为预设的滤波器数;/n第14个卷积层使用128个大小为1*1的卷积核,输出的特征图为13*13*128,输出至上采样模块;上采样模块完成上采样对输入的特征图完成上采样处理后,输出的特征图为26*26*256,与第8个卷积层8的输出相连接输出至第16个卷积层;/n第15个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第2个物体检测层;/n第2个物体检测层使用n个大小为1*1的卷积核,输出的特征图为26*26*n,输出至第2个物体检测深度网络,第2个物体检测深度网络在26*26这个尺度上进行位置及物体类别预测;/n车辆检测网络得到13*13和26*26这两个尺度的预测结果之后使用非极大值抑制算法得到最终的车辆检测结果;/n2)将样本图片分别标记车辆位置和类型形成数据集,利用数据集完成对车辆检测网络的训练;/n3)车辆检测步骤:来自于车载摄像头输入的图像使用所述车辆检测网络进行车辆检测,得到图像中的车辆预选框;/n4)着地点定位步骤:获得车辆预选框中心,相对于车辆预选框的宽不变,高增长1.2倍,以预选框中心为中心再取候选框;取候选框底部1/6部分进行Y轴上的像素的累加计算,得到Y轴-像素和的直方图;所述直方图经过均值滤波之后,将Y轴方向上的最小值所对应在候选框中的水平线作为车辆的着地点所在的位置。/n...

【技术特征摘要】
1.一种基于卷积神经网络的车辆检测及着地点定位方法,其特征在于,包括以下步骤:
1)设计车辆检测网络架构:
车辆检测网络包括15个卷积层、2个残差层、1个上采样层、2个物体检测层;
车辆检测网络接收输入的图像为RGB三通道的彩色图片,大小为416*416;
前5层卷积网络的结构与YOLOV3-tiny网络前5层卷积网络相同,对输入图像进行特征的初步提取,第5个卷积层输出的特征图为26*26*256,输出至第6个卷积层、第1个残差层;
第6个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第7个卷积层、第2个残差层;
第7个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第1个残差层;第1个残差层连接输入的来自第5、第7个卷积层的特征图后输出至第8个卷积层;
第8个卷积层使用256个大小为1*1的卷积核,输出的特征图为26*26*256,输出至第15个卷积层、第2个残差层;第2个残差层连接输入的来自第6、第8个卷积层的特征图后输出至第9个卷积层;
第9个卷积层使用512个大小为1*1的卷积核,输出的特征图为26*26*512,输出至第10个卷积层;
第10个卷积层使用512个大小为3*3的卷积核,输出的特征图为13*13*512,输出至第11个卷积层;
第11个卷积层使用1024个大小为1*1的卷积核,输出的特征图为13*13*1024,输出至第12个卷积层;
第12个卷积层使用256个大小为1*1的卷积核,输出的特征图为13*13*256,输出至第13、第15个卷积层;
第13个卷积层使用512个大小为1*1的卷积核,输出的特征图为13*13*512,输出至第1个物体检测层;
第1个物体检测层使用n个大小为1*1的卷积核,输出的特征图为13...

【专利技术属性】
技术研发人员:邓建华周群芳俞泉泉余坤常为弘肖正欣俞婷魏傲寒罗凌云陈翔
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1