【技术实现步骤摘要】
一种用于自动驾驶的用于训练神经网络对象检测模型的用于确定锚框的方法
本公开的实施例一般涉及操作自动车辆。更具体地,本公开的实施例涉及训练用于自动驾驶的神经网络对象检测模型。
技术介绍
以自动模式(例如,无人驾驶)操作的车辆可以免除乘坐者,尤其是驾驶员的一些驾驶相关责任。当在自动模式下操作时,车辆可以使用车载传感器导航到各种位置,从而允许车辆以最小的人机交互或者在一些没有任何乘客的情况下行驶。运动规划和控制是自动驾驶中的关键操作。在自动驾驶中,重要的是检测自动驾驶车辆(ADV)周围的对象,以便为ADV规划轨迹以导航通过该驾驶环境。最近,已经使用人工智能(AI)进行对象检测。使用深度神经网络的对象检测模型通常利用锚框(AnchorBox)的概念,锚框被预定义为具有确定的大小和形状。神经网络通过回归锚框上的变化估计对象边界框(BoundingBox),而不是直接估计对象边界框的宽度和高度。结果,良好的锚框选择等同于提供边界框估计上的良好的先验,并且因此神经网络更容易学习和产生更高的对象检测性能。然而,缺乏识 ...
【技术保护点】
1.一种用于自动驾驶的用于确定训练神经网络对象检测模型用锚框的方法,所述方法包括:/n基于多个边界框的各自的维度,在二维(2D)空间中绘制所述多个边界框;/n基于所述多个边界框在所述2D空间上的分布密度,将所述多个边界框聚类为所述边界框的一个或多个聚类;/n对于所述边界框的所述聚类中的每一个,确定锚框以表示对应的聚类;以及/n使用所述锚框训练用于检测对象的神经网络模型,其中所述神经网络模型被用于基于由自动驾驶车辆的传感器捕获的图像或点云中的至少一个来检测对象。/n
【技术特征摘要】
20190628 US 16/457,8201.一种用于自动驾驶的用于确定训练神经网络对象检测模型用锚框的方法,所述方法包括:
基于多个边界框的各自的维度,在二维(2D)空间中绘制所述多个边界框;
基于所述多个边界框在所述2D空间上的分布密度,将所述多个边界框聚类为所述边界框的一个或多个聚类;
对于所述边界框的所述聚类中的每一个,确定锚框以表示对应的聚类;以及
使用所述锚框训练用于检测对象的神经网络模型,其中所述神经网络模型被用于基于由自动驾驶车辆的传感器捕获的图像或点云中的至少一个来检测对象。
2.如权利要求1所述的方法,其中所述2D空间的X轴表示边界框的宽度,以及所述2D空间的Y轴表示所述边界框的高度。
3.如权利要求1所述的方法,其中对所述边界框进行聚类以及确定锚框以表示所述聚类中的每一个包括:
对于所述边界框中的每一个,计算所述边界框与所述锚框中的每一个锚框之间的匹配度;以及
将所述边界框分配给所述锚框中的具有最大重叠面积的一个锚框。
4.如权利要求3所述的方法,还包括:
确定分配给所述锚框的所述边界框的分布是否满足预定的条件;以及
响应于确定所述预定的条件没有被满足,
调整所述锚框中的至少一个锚框在所述2D空间上的维度,以及
迭代地对每一个边界框与每一个锚框之间的匹配度进行计算,以及将每一个边界框分配给所述锚框中的一个锚框,直到满足所述预定的条件。
5.如权利要求4所述的方法,其中所述预定的条件要求分配给所述锚框中的每一个锚框的边界框的数量大于预定的阈值。
6.如权利要求4所述的方法,其中所述预定的条件要求所述锚框中的每一个锚框落入所述边界框在所述2D空间上的密集区内。
7.如权利要求4所述的方法,其中所述预定的条件要求所述边界框中的分配给特定锚框的每一个边界框的纵横比在预定的范围内。
8.如权利要求3所述的方法,其中所述边界框和每一个锚框之间的所述匹配度是基于所述边界框和每一个锚框之间的重叠面积确定的。
9.如权利要求8所述的方法,其中计算所述边界框和每一个锚框之间的匹配度包括计算所述边界框和每一个锚框之间的交并(IOU)比以表示所述匹配度。
10.一种用于自动驾驶的用于确定训练神经网络对象检测模型用锚框的装置,所述装置包括:
绘制装置,被配置为基于多个边界框的各自的维度,在二维(2D)空间中绘制所述多个...
【专利技术属性】
技术研发人员:蔡家伟,崔泰恩,郭玉亮,陈光,张伟德,
申请(专利权)人:百度美国有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。