使用适合停车位检测的倾斜多边形进行对象检测制造技术

技术编号：30733933 阅读：40 留言：0更新日期：2021-11-10 11:37

神经网络可用于确定倾斜多边形的角点(例如，作为锚框角点的位移值)，其准确地描绘了图像中定义停车位的区域。此外，神经网络可以输出预测锚框的角点对应于停车位入口的可能性的置信值。置信值可用于选择锚框和/或倾斜多边形的角点的子集，以便定义停车位的入口。使用CNN预测的倾斜多边形的角点与停车位的地面实况角点之间的最小聚合距离可以用于简化关于是否应将锚框用作训练的正样本的确定。于是否应将锚框用作训练的正样本的确定。于是否应将锚框用作训练的正样本的确定。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用适合停车位检测的倾斜多边形进行对象检测

技术介绍

[0001]机器(例如，使用经训练的神经网络编程的计算机)进行准确有效的图像处理(例如，用于识别和分类)在各种情况下都很重要。例如，自主车辆(例如，配备高级驾驶辅助系统(ADAS)的车辆)或无人机可以实时分析图像数据(例如，表示由相机捕获的道路和/或停车场的图像)以制定驾驶操作(例如，向左转动转向装置、启动制动系统等)。在一个这样的实例中，车辆可以在执行停车操作时分析图像数据以检测停车位，并识别停车位的属性，例如位置、大小和方位。为了促进这个过程，车辆可能包括对象检测器，该检测器使用卷积神经网络(CNN)来检测图像中停车位的存在。
[0002]用于检测停车位的传统CNN可能使用轴对齐的矩形锚框(所有四个角都是直角)作为检测输出的一种形式。然而，由于传感器的透视投影，传感器数据中存在的停车位通常不是矩形或轴对齐的。因此，一旦检测到传感器数据，就需要额外的处理来准确地识别每个停车位的边界。例如，车辆上的相机可能会捕获停车位的图像，并且基于相机视场的视角，停车位可能不会在图像中描绘为轴对齐的矩形。传统的CNN可能会提供一个轴对齐的矩形锚框作为检测输出的一种形式，在这种情况下，需要额外的处理来准确地描绘图像中的停车位。在训练传统CNN时，可以使用来自CNN的锚框输出和地面实况输出之间的联合相交(IoU)来识别正样本。IoU计算可能很简单，因为锚框输出和地面实况都是轴对齐的矩形。

技术实现思路

[0003]本公开涉及使用适用于停车位检测的倾斜多边形(例如，四边形)的对象检测。...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法，包括：将表示停车位的图像数据应用到神经网络；使用所述神经网络接收由所述图像数据生成的并表示到锚形状的角点的位移值的数据；根据到所述锚形状的角点的所述位移值确定倾斜多边形的角点；计算所述倾斜多边形的所述角点与所述停车位的地面实况角点之间的第一距离；至少部分地基于所述第一距离确定样本评级；以及基于所述样本评级低于阈值，使用所述锚形状作为正训练样本更新所述神经网络的参数。2.如权利要求1所述的方法，其中所述第一距离包括最小聚合距离，并且其中所述样本评级是所述最小聚合距离的归一化版本。3.如权利要求1所述的方法，其中确定所述样本评级包括至少部分地基于由所述停车位的所述地面实况角点定义的多边形的面积来归一化所述第一距离。4.如权利要求1所述的方法，其中所述倾斜多边形是第一倾斜四边形并且所述锚形状是第二倾斜四边形。5.如权利要求1所述的方法，其中所述锚形状是由一个或更多个地面实况样本生成的数据驱动的锚框。6.如权利要求1所述的方法，其中所述第一距离是所述倾斜多边形的所述角点的不同组合与所述停车位的所述地面实况角点之间的最小平均距离。7.如权利要求1所述的方法，其中所述斜多边形的所述角点包括第一角(A1)、第二角(A2)、第三角(A3)和第四角(A4)；其中，所述停车位的所述地面实况角点的角点包括第五角(B1)、第六角(B2)、第七角(B3)和第八角(B4)；并且其中计算所述第一距离包括根据距离(A1，B1)、(A2，B2)、(A3，B3)和(A4，B4)计算第一归一化聚合距离；根据距离(A1，B2)、(A2，B3)、(A3，B4)和(A4，B1)计算第二归一化聚合距离；根据距离(A1，B3)、(A2，B4)、(A3，B1)和(A4，B2)计算第三归一化聚合距离；以及根据距离(A1，B4)、(A2，B1)、(A3，B2)和(A4，B3)计算第四归一化聚合距离，并且所述第一距离是所述第一归一化聚合距离、所述第二归一化聚合距离、所述第三归一化聚合距离和所述第四归一化聚合距离中的最小值。8.一种计算机实现的方法，包括：将表示环境中的至少一个传感器的视场的传感器数据应用于神经网络；从所述神经网络接收由所述传感器数据生成的第一数据和第二数据，所述第一数据表示到锚形状的角点的位移值，以及所述第二数据表示预测所述锚形状对应于所述至少一个传感器的所述视场内的停车位的可能性的置信值；以及至少部分地基于所述置信值超过阈值，确定与所述锚形状的角点的所述位移值相对应的倾斜多边形的角点。9.如权利要求8所述的方法，其中所述锚形状是与所述神经网络的空间元素相关联的多个锚形状，并且针对所述多个锚形状的每个给定锚形状，所述神经网络输出表示到所述给定锚形状的角点的位移值和预测所述给定锚形状对应于所述至少一个传感器...

【专利技术属性】
技术研发人员：D，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人