用于对象检测的方法和系统技术方案

技术编号:34993354 阅读:7 留言:0更新日期:2022-09-21 14:40
用于对象检测的方法和系统。提供了一种用于对象检测的计算机实现方法,所述方法包括由计算机硬件组件执行的以下步骤:基于输入数据来确定第一池化层的输出;基于第一池化层的输出,确定被直接设置在第一池化层之后的扩张卷积层的输出;基于扩张卷积层的输出,确定被直接设置在扩张卷积层之后的第二池化层的输出;以及至少基于扩张卷积层的输出或者第二池化层的输出来执行对象检测。层的输出来执行对象检测。层的输出来执行对象检测。

【技术实现步骤摘要】
用于对象检测的方法和系统


[0001]本公开涉及用于对象检测的方法和系统。

技术介绍

[0002]可以将诸如摄像机、雷达传感器或LIDAR传感器的各种传感器用于汽车应用中以监测车辆的环境。驾驶员辅助系统可以利用从传感器捕获的数据,例如通过分析该数据来检测对象。对于对象检测,可以使用卷积神经网络(CNN)。然而,对象检测可能是麻烦的任务。
[0003]因此,需要提供一种实现高效且准确的结果的对象检测用方法和系统。

技术实现思路

[0004]在一个方面,本公开致力于一种用于对象检测的计算机实现方法,所述方法包括由计算机硬件组件执行(换句话说:实行)的以下步骤:基于输入数据来确定第一池化层的输出;基于该第一池化层的输出,来确定被直接设置在该第一池化层之后的扩张卷积层的输出;基于该扩张卷积层的输出,来确定被直接设置在该扩张卷积层之后的第二池化层的输出;以及至少基于该扩张卷积层的输出或者第二池化层的输出,来执行对象检测。
[0005]换句话说,第一池化层中的池化操作是基于输入数据的,以确定第一池化层的输出。在执行池化操作之前,可以使输入数据经受另外的层(例如,另外的扩张卷积层)。第一池化层的输出是扩张卷积层的输入。扩张卷积层直接跟随在第一池化层之后(换句话说:在第一池化层与扩张卷积层之间未设置另外的层)。扩张卷积层中的扩张卷积操作确定扩张卷积层的输出。扩张卷积层的输出是第二池化层的输入。第二池化层直接跟随在扩张卷积层之后(换句话说:在扩张卷积层与第二池化层之间未设置另外的层)。另一方面,紧接在第二池化层之前的是扩张卷积层,并且紧接在扩张卷积层之前的是第一池化层。对象检测是至少基于扩张卷积层的输出或者第二池化层的输出的。
[0006]应理解,可以在输入数据与第一池化层之间设置一个或更多个层。同样地,可以在第二池化层之后设置一个或更多个其它层。
[0007]例如,可以提供一系列扩张卷积层的结构,各个扩张卷积层后面是相应的池化层。例如,可以提供这样的交替结构:单个扩张卷积层接着相应的单个池化层。
[0008]对象检测可以被理解为图像分类和对象定位的组合。这意味着,对象检测通过在图像中的各个关注对象周围绘制边界框并向这些对象指派类标签来定位诸如汽车、公共汽车、行人等的对象的存在和类型。用于对象检测的输入可以是具有至少一个对象的数据集(例如,来自雷达传感器、或者来自激光雷达传感器、或来自摄像机的数据集,例如,图像)。对象检测的输出可以是至少一个边界框以及各个边界框的类标签,其中,边界框可以是由边界框的中心点的坐标及其宽度和高度描述的矩形框,并且其中,类标签可以是涉及特定类型的对象的整数值。对象检测被广泛地用于许多领域,例如,通过在所拍摄的图像中识别车辆、行人、道路以及障碍物等的位置而用于自动驾驶技术。
[0009]输入数据可以是从传感器(比如雷达传感器、摄像机或LIDAR传感器)捕获的数据,或者可以包括来自如下面将详细描述的系统的数据。
[0010]卷积层可以执行被称为卷积操作或卷积的操作。在卷积神经网络(CNN)的背景下,卷积可以是处理权重集与输入数据集的乘法的线性操作。该权重集可以被称为过滤器或核。乘法可以是点积,这意味着在核元素(kernel element)与输入数据的具有与核相同大小的一部分之间的逐元素乘法。相乘结果可以被相加并且可以产生单个值。卷积层中的所有卷积的所有单个值均可以限定卷积层的输出。核的大小可以根据权重的数量来确定。
[0011]扩张卷积层例如可以是如图4所示的第二扩张卷积层428,其由卷积层组成,其中,在核元素之间存在自由空间。换句话说,通过在核元素之间添加零权重来增加核的接受域。下面将进行详细的描述。
[0012]池化层可以执行可被称为池化操作或池化的操作。池化层可以聚集扩张卷积层的输出(即,集中于最相关的信息),并且可以减少为检测给定输入数据中的对象所需的参数的数量。因此,池化层的输出可以是由扩张卷积层生成的输出的缩小范围,包括概括的特征而不是精确定位的特征。这可以实现更好的性能和更低的存储器需求。
[0013]根据实施方式,所述方法还包括由计算机硬件组件执行的以下步骤:基于第二池化层的输出来确定被直接设置在该第二池化层之后的另一扩张卷积层的输出;以及基于该另一扩张卷积层的输出来确定被直接设置在该另一扩张卷积层之后的另一池化层的输出;其中,对象检测是进一步基于至少该另一扩张卷积层的输出或者该另一池化层的输出来执行的。
[0014]换句话说,存在另一扩张卷积层和另一池化层,其中,该另一扩张卷积层和该另一池化层是以如下方式设置的:该另一扩张卷积层直接跟随在第二池化层之后(换句话说:在第二池化层与该另一扩张卷积层之间未设置另外的层),并且该另一池化层直接跟随在该另一扩张卷积层之后(换句话说:在该另一扩张卷积层与该另一池化层之间未设置另外的层)。第二池化层的输出是该另一扩张卷积层的输入,而该另一扩张卷积层的输出是该另一池化层的输入。对象检测是进一步基于至少该另一扩张卷积层的输出或者该另一池化层的输出来执行的。
[0015]根据各种实施方式,可以存在多个另外的扩张卷积层和多个另外的池化层,其中,所述多个另外的扩张卷积层中的各个扩张卷积层直接跟随在所述多个另外的池化层中的相应池化层,并且该组合直接跟随在已经存在的最后池化层之后。然后,对象检测是可以进一步基于至少各个层(扩张卷积层和/或池化层)的输出中的至少一个输出来执行的。
[0016]各个扩张卷积层可以识别可以与特定任务相关的不同特征。通过扩张卷积层与池化层的组合,减小了维度(dimension)并因此减小了参数的数量。
[0017]根据实施方式,所述方法还包括由计算机硬件组件执行的以下步骤:将扩张卷积层的输出和该另一扩张卷积层的输出上采样至预定分辨率;以及级联扩张卷积层的输出和该另一扩张卷积层的输出,其中,对象检测是基于经级联的输出来执行的。
[0018]本文所使用的上采样可以是指增加扩张卷积层的输出和该另一扩张卷积层的输出的维度。这可以例如通过重复扩张卷积层的输出的和该另一扩张卷积层的输出的行和列来完成。上采样的另一可能性可以是反向卷积层。反向卷积层可以执行逆卷积操作,即,卷积层的前向步骤(pass)和反向步骤被颠倒。
[0019]预定分辨率是输入数据的分辨率,或者是被设置在第一池化层之前的又一个另外的扩张卷积层或另外的卷积层的分辨率。
[0020]还可以对又一另外的扩张卷积层的输出进行上采样和级联。
[0021]级联扩张卷积层的输出和该另一扩张卷积层的输出的输出可以被称为级联输出。
[0022]根据实施方式,扩张卷积层的核的扩张率可以不同于该另一扩张卷积层的核的扩张率。
[0023]核的扩张率可以限定核元素之间的间距,其中,该间距填充有零元素。扩张率为一是指着核元素之间没有间距,由此,核元素彼此紧邻地定位。扩张率等于或大于二的核的大小通过在核元素之间添加零权重来增加,以使例如扩张率二可以在核元素之间添加一个零权重元素本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于对象检测的计算机实现方法,所述方法包括由计算机硬件组件执行的以下步骤:基于输入数据(402)来确定第一池化层(424)的输出(408);基于所述第一池化层(424)的输出(408),确定被直接设置在所述第一池化层(424)之后的扩张卷积层(428)的输出(412);基于所述扩张卷积层(428)的输出(412),确定被直接设置在所述扩张卷积层(428)之后的第二池化层(430)的输出(414);以及至少基于所述扩张卷积层(428)的输出(412)或者所述第二池化层(430)的输出(414),执行所述对象检测。2.根据权利要求1所述的方法,所述方法还包括由所述计算机硬件组件执行的以下步骤:基于所述第二池化层(430)的输出(414),确定被直接设置在所述第二池化层(430)之后的另一扩张卷积层(506)的输出;以及基于所述另一扩张卷积层(506)的输出,确定被直接设置在所述另一扩张卷积层(506)之后的另一池化层(508)的输出;其中,所述对象检测还至少基于所述另一扩张卷积层(506)的输出或者所述另一池化层(508)的输出来执行。3.根据权利要求2所述的方法,所述方法还包括由所述计算机硬件组件执行的以下步骤:将所述扩张卷积层(428)的输出和所述另一扩张卷积层(506)的输出上采样至预定分辨率;以及级联(528)所述扩张卷积层(428)的输出和所述另一扩张卷积层(506)的输出;其中,所述对象检测是基于所级联的输出(542、544)来执行的。4.根据权利要求2或3所述的方法,其中,所述扩张卷积层(428)的核的扩张率不同于所述另一扩张卷积层(506)的核的扩张率。5.根据权利要求1至4中任一项所述的方法,其中...

【专利技术属性】
技术研发人员:苏煜M
申请(专利权)人:APTIV技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1