目标检测方法、存储介质、路侧设备及自动驾驶系统技术方案

技术编号:38002393 阅读:8 留言:0更新日期:2023-06-30 10:16
本发明专利技术涉及一种基于深度学习网络的目标检测方法,包括:获取由图像传感器采集的原始图像;将所述原始图像输入到具有预先训练好的模型参数的深度学习网络中,以得到目标物体的预测结果;在所述原始图像中的所有预测框之间求损失,其中将求损失结果小于设定阈值的预测框归属为同一目标物体;以及从归属为同一目标物体的预测框中选取类别置信度最高的类别和所对应的预测框作为该目标物体的最终检测结果,其中,所述预先训练好的模型参数通过在所述深度学习网络的训练过程中使用目标物体的人工标注的真实框进行训练来确定。本发明专利技术还涉及一种计算机可读存储介质,一种包括该计算机可读存储介质的路侧设备,以及一种自动驾驶系统。统。统。

【技术实现步骤摘要】
目标检测方法、存储介质、路侧设备及自动驾驶系统


[0001]本专利技术涉及图像目标检测领域,更具体而言,本专利技术涉及一种基于深度学习网络的目标检测方法,一种计算机可读存储介质,一种包括该计算机可读存储介质的路侧设备,以及一种自动驾驶系统。

技术介绍

[0002]在自动驾驶和V2X技术中,摄像头起到了至关重要的作用。摄像头连同基于深度学习的目标检测算法一起能有效识别出目标的大小、位置、类别等信息。这使得自动驾驶车辆和路侧端的设备对于周围的交通环境拥有很强的感知能力。在基于深度学习网络的目标检测算法中,单目摄像头的目标检测算法由于成本低、延时低、部署容易等优点被广泛应用。
[0003]目前,基于深度学习网络的单目摄像头目标检测算法大多为2D检测算法,其只能识别物体的大小,而无法识别物体的形状。这对于准确识别物体位置及不同物体之间的相对位置造成很大困难。例如,在利用路侧端的摄像头检测道路上的行驶车辆的过程中,在遇到上下班高峰期或堵车时,各个车辆在三维世界中彼此距离较近,此时用2D目标检测算法检测出来的结果很有可能是两辆车已经撞上了,这显然是不准确的。
[0004]3D目标检测算法能检测出车辆更加准确的位置信息,因此能有效避免上述问题。然而,目前的3D目标检测算法需要大量的摄像头内外参数数据作为训练集,才能输出物体在世界坐标系下的三维信息,不仅运算过程复杂,而且使得最终的检测结果不准确。

技术实现思路

[0005]为了解决现有的单目摄像头目标检测算法不够准确且应用场景有限的问题,本专利技术提出一种新的基于深度学习网络的目标检测方法。该方法是基于先验框的目标检测算法,不同于传统的基于先验框的目标检测算法,本专利技术的目标检测算法中所使用到的先验框是像素层面的3D先验框,并且本专利技术还设计了一套与之对应的匹配学习算法来进行模型训练。
[0006]根据本专利技术的第一方面,提供了一种基于深度学习网络的目标检测方法,该目标检测方法包括以下步骤:
[0007]获取由图像传感器采集的原始图像,所述原始图像包括至少一个目标物体;
[0008]将所述原始图像输入到具有预先训练好的模型参数的深度学习网络中,以得到所述至少一个目标物体的预测结果,所述预测结果包括所述原始图像中的多个预测框,每个预测框具有对应的物体类别和类别置信度;
[0009]在所述原始图像中的所有预测框之间求损失,其中将求损失结果小于设定阈值的预测框归属为同一目标物体;以及
[0010]从归属为同一目标物体的预测框中选取类别置信度最高的类别和所对应的预测框作为该目标物体的最终检测结果,
[0011]其中,所述预先训练好的模型参数通过在所述深度学习网络的训练过程中使用所
述至少一个目标物体的人工标注的真实框进行训练来确定。
[0012]根据一个可选的实施例,所述深度学习网络的训练过程包括以下步骤:
[0013]创建待用于进行训练的图像数据,所述图像数据包括至少一个目标物体的人工标注的真实框和对应的物体类别;
[0014]针对每个目标物体利用聚类算法基于所述人工标注的真实框生成多个先验框;
[0015]利用损失函数计算每个先验框与所述人工标注的真实框之间的损失值,并将损失值小于设定值的先验框确定为正样本;
[0016]利用梯度下降算法对所有正样本进行优化,以使相应的损失函数收敛至最小值,从而得到训练后的模型参数;以及
[0017]将所得到的模型参数加载到待用于图像目标检测的所述深度学习网络中。
[0018]根据一个可选的实施例,所述深度学习网络的训练过程还包括如下步骤:
[0019]获取图像数据上的所有真实框的中心点坐标和角点坐标;
[0020]利用聚类算法将所获取的中心点坐标和角点坐标聚类为多个坐标集,每个坐标集合对应于一种物体类别;以及
[0021]将所述多个坐标集转换为相应的物体类别的先验框。
[0022]根据一个可选的实施例,所述损失函数由下述公式确定:
[0023]L=k*Lc+Lr,
[0024]其中,k为比例系数,Lc代表分类损失,Lr代表所述正样本的角点回归损失。
[0025]根据一个可选的实施例,所述深度学习网络包括:
[0026]第一部分,用于从原始图像中提取出与所述至少一个目标物体有关的多个不同层级的原始特征图;
[0027]第二部分,用于对所述多个不同层级的原始特征图进行信息融合,以生成待进一步用于特征检测的多层特征图;以及
[0028]第三部分,用于基于所述多层特征图生成并输出所述至少一个目标物体的预测结果。
[0029]根据一个可选的实施例,所述深度学习网络为卷积神经网络,并且第一部分为主干部分,所述第二部分为脖颈部分,所述第三部分为检测头部分。
[0030]根据一个可选的实施例,在所述深度学习网络的训练过程中在由所述第二部分提供的每层特征图上生成相同数量、不同大小和不同形状的多个先验框。
[0031]根据一个可选的实施例,通过对所述图像数据进行数据增强处理,以增加待用于训练的数据集。
[0032]根据一个可选的实施例,所述数据增强处理包括图像反转、图像亮度和对比度调整、马赛克数据增强、随机裁剪以及随机缩放中的至少一种。
[0033]根据一个可选的实施例,所述图像传感器为单目摄像头。
[0034]根据一个可选的实施例,该目标检测方法还包括:
[0035]确定所述单目摄像头的标定参数;
[0036]基于所述单目摄像头的标定参数将所述至少一个目标物体的预测框变换为在世界坐标系下的尺寸和位置信息。
[0037]根据本专利技术的第二方面,还提供了一种计算机可读存储介质,在该计算机可读存
储介质上存储有计算机程序,其包括程序指令,所述程序指令在被处理器执行时实施如上所述的目标检测方法的各个步骤。
[0038]根据本专利技术的第三方面,还提供了一种路侧设备,包括:
[0039]路侧端摄像头,用于采集路侧端的图像;
[0040]如上所述的计算机可读存储介质;以及
[0041]处理器,所述处理器配置为基于由所述路侧端摄像头采集的图像执行所述计算机可读存储介质中的所述程序指令,以检测图像中的目标对象。
[0042]根据本专利技术的第三方面,还提供了一种自动驾驶系统,该自动驾驶系统包括:
[0043]车载摄像头,用于采集车辆周围的道路图像;
[0044]道路环境监测单元,该道路环境监测单元配置为基于由所述车载摄像头获取的道路图像利用如上所述的目标检测方法来确定车辆周围的道路状况;以及
[0045]车辆控制单元,所述车辆控制单元配置为根据由所述道路环境监测单元确定的道路状况控制车辆执行相应的自动驾驶操作。
[0046]利用根据本专利技术的深度学习网络所获得的目标检测方法可同时适用于路侧端摄像头和车载摄像头,并且可将检测结果应用至V2X算法或车辆自动驾驶算法中,从而提高V2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习网络的目标检测方法,其特征在于,该目标检测方法包括以下步骤:获取由图像传感器采集的原始图像,所述原始图像包括至少一个目标物体;将所述原始图像输入到具有预先训练好的模型参数的深度学习网络中,以得到所述至少一个目标物体的预测结果,所述预测结果包括所述原始图像中的多个预测框,每个预测框具有对应的物体类别和类别置信度;在所述原始图像中的所有预测框之间求损失,其中将求损失结果小于设定阈值的预测框归属为同一目标物体;以及从归属为同一目标物体的预测框中选取类别置信度最高的类别和所对应的预测框作为该目标物体的最终检测结果,其中,所述预先训练好的模型参数通过在所述深度学习网络的训练过程中使用所述至少一个目标物体的人工标注的真实框进行训练来确定。2.根据权利要求1所述的目标检测方法,其特征在于,所述深度学习网络的训练过程包括以下步骤:创建待用于进行训练的图像数据,所述图像数据包括至少一个目标物体的人工标注的真实框和对应的物体类别;针对每个目标物体利用聚类算法基于所述人工标注的真实框生成多个先验框;利用损失函数计算每个先验框与所述人工标注的真实框之间的损失值,并将损失值小于设定值的先验框确定为正样本;利用梯度下降算法对所有正样本进行优化,以使相应的损失函数收敛至最小值,从而得到训练后的模型参数;以及将所得到的模型参数加载到待用于图像目标检测的所述深度学习网络中。3.根据权利要求2所述的目标检测方法,其特征在于,所述深度学习网络的训练过程还包括如下步骤:获取图像数据上的所有真实框的中心点坐标和角点坐标;利用聚类算法将所获取的中心点坐标和角点坐标聚类为多个坐标集,每个坐标集合对应于一种物体类别;以及将所述多个坐标集转换为相应的物体类别的先验框。4.根据权利要求2或3所述的目标检测方法,其特征在于,所述损失函数由下述公式确定:L=k*Lc+Lr,其中,k为比例系数,Lc代表分类损失,Lr代表所述正样本的角点回归损失。5.根据权利要求1至3中任一项所述的目标检测方法,其特征在于,所述深度学习网络包括:第一部分,用于从原始图像中提取出与所述至少一个目标物体有关的多个不同层级的原始特征图;第二部分,用于对所述多个不同层级的原始特...

【专利技术属性】
技术研发人员:黄德璐文峰
申请(专利权)人:大陆软件系统开发中心重庆有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1