具有空间不确定性的对象检测网络制造技术

技术编号：34763912 阅读：22 留言：0更新日期：2022-08-31 19:08

提供了一种用于对象检测网络的硬件加速器和一种用于检测对象的方法。本公开提供了稳健的对象检测，该稳健的对象检测有利地增强了具有空间不确定性的传统确定性边界框预测，以用于各种计算机视觉应用，诸如例如自主驾驶、机器人手术等。机器人手术等。机器人手术等。

全部详细技术资料下载

【技术实现步骤摘要】
具有空间不确定性的对象检测网络

技术介绍

[0001]本公开涉及计算机系统。更具体地，本公开涉及包括对象检测网络的计算机系统。
[0002]预测是许多分类和对象检测网络的基本元素，该分类和对象检测网络包括机器学习(ML)(诸如，例如，具有单个隐藏层的ANN(即浅层ANN))、深度神经网络(DNN)(诸如具有多个隐藏层的ANN(即深度ANN))、卷积神经网络(CNN)、递归神经网络(RNN)等，支持向量机(SVM)、决策树、贝叶斯网络等。然而，由于许多原因(诸如，例如，某个类的数据不足、不属于分布(OOD)的输入数据(即不属于任何类的数据)等)，因此网络永远无法实现100％的预测准确度。在硬件和软件中实现的网络也容易受到硬错误和软错误的影响，这可能会降低预测准确度或者导致致命事件。通常，分类和对象检测网络仅基于输入数据以及底层训练方法和数据提供“最佳”预测。
[0003]对象检测网络(诸如CNN)通常在推断期间生成确定性标签和对象边界框。边界框是大体上围绕对象的矩形，并且由位置(即，x、y坐标对)、宽度和高度定义。这些确定性输出通常过于自信，从而产生对标签和边界框位置和尺寸的错误预测。可使用各种技术来推断标签不确定性。不幸的是，没有用于预测边界框空间不确定性的已知技术，这对于许多工业应用可能很重要，在这些工业应用中，由于遮挡、照明条件等原因可能无法完全检测到对象。
附图说明
[0004]图1描绘了根据本公开的实施方案的ANN。
[0005]图2A和图2B描绘了根据本公开的实施方案的CNN。
[00...

【技术保护点】

【技术特征摘要】
1.一种用于对象检测的硬件加速器，所述硬件加速器包括：主干特征提取(BFE)模块，所述BFE模块被配置为：接收包括至少一个对象的图像数据，以及基于所述图像数据生成多个特征张量，每个特征张量具有不同的尺度；特征检测(FD)模块，所述FD模块被配置为：接收来自所述BFE模块的所述特征张量，执行多次检测经过，每次检测经过包括：向所述特征张量应用随机丢包掩码，以及对于每个特征张量，确定尺度依赖边界框空间数据，所述尺度依赖边界框空间数据包括用于所述对象的多个尺度依赖边界框的平均角坐标和所述角坐标的协方差矩阵，以及生成与每个特征张量相关联的中间张量，每个中间张量包括用于所述相关联特征张量的每次检测经过的所述尺度依赖边界框空间数据；和滤波和平均(FA)模块，所述FA模块被配置为：接收来自所述FD模块的所述中间张量，基于所述中间张量来确定尺度独立边界框空间数据，所述尺度独立边界框空间数据包括用于所述对象的尺度独立边界框的平均角坐标和所述角坐标的协方差矩阵，以及生成包括所述尺度独立边界框空间数据的输出张量。2.根据权利要求1所述的硬件加速器，其中每个特征张量包括由高度、宽度和多个通道定义的特征图数据，并且所述特征张量的所述尺度被定义为高度
·
宽度。3.根据权利要求2所述的硬件加速器，其中所述FD模块包括：丢包掩码生成模块，所述丢包掩码生成模块被配置为针对每次检测经过生成用于每个特征张量的随机丢包掩码；和多个检测器头，每个检测器头包括多个卷积模块和至少一个丢包掩码应用模块，每个检测器头被配置为：接收不同特征张量，以及对于每次检测经过，基于所述特征张量和相应丢包掩码来确定用于所述对象的所述多个尺度依赖边界框，以及基于所述多个尺度依赖边界框来确定所述尺度依赖边界框空间数据。4.根据权利要求3所述的硬件加速器，其中每个检测器头被配置为确定客观评分和类别概率。5.根据权利要求3所述的硬件加速器，其中：所述FD模块包括第一检测器头和第二检测器头，所述第一检测器头被配置为接收具有第一尺度的第一特征张量，并且所述第二检测器头被配置为接收具有大于所述第一尺度的第二尺度的第二特征张量；所述第二检测器头包括上采样器模块和级联模块，所述上采样器模块被配置为接收来自所述第一检测器头的第一卷积模块的所述第一特征张量以及增加所述第一特征张量的所述尺度以匹配所述第二特征张量的所述尺度，并且所述级联模块被配置为级联所述放大第一特征张量和所述第二特征张量以及将所述级联的第二特征张量提供给所述第二检测
器头的第一卷积模块；并且所述级联的第二特征张量具有的通道总数等于所述放大第一特征张量的通道数量加上所述第二特征张量的通道数量。6.根据权利要求5所述的硬件加速器，其中：所述FD模块包括第三检测器头，所述第三检测器头被配置为接收第三特征张量，所述第三特征张量具有大于所述第二尺度的第三尺度；所述第三检测器头包括上采样器模块和级联模块，所述上采样器模块被配置为接收来自所述第二检测器头的第一卷积模块的所述第二特征张量以及增加所述第二特征张量的所述尺度以匹配所述第三特征张量的所述尺度，所述级联模块被配置为级联所述放大第二特征张量和所述第三特征张量以及将所述级联的第三特征张量提供给所述第三检测器头的第一卷积模块；并且所述级联的第三特征张量具有的通道总数等于所述放大第二特征张量的通道数量加上所述第三特征张量的通道数量。7.根据权利要求6所述的硬件加速器，其中：所述第一检测器头还包括耦合到所述第一卷积模块和所述丢包掩码生成模块的第一掩码模块、耦合到所述第一掩码模块的第二卷积模块、耦合到所述第二卷积模块和所述丢包掩码生成模块的第二掩码模块、以及耦合到所述第二掩码模块的第三卷积模块；所述第二检测器头还包括耦合到所述第一卷积模块和所述丢包掩码生成模块的第一掩码模块、耦合到所述第一掩码模块的第二卷积模块、耦合到所述第二卷积模块和所述丢包掩码生成模块的第二掩码模块、以及耦合到所述第二掩码模块的第三卷积模块；并且所述第三检测器头还包括耦合到所述第一卷积模块和所述丢包掩码生成模块的第一掩码模块、耦合到所述第一掩码模块的第二卷积模块、耦合到所述第二卷积模块和所述丢包掩码生成模块的第二掩码模块、以及耦合到所述第二掩码模块的第三卷积模块。8.根据权利要求1所述的硬件加速器，其中所述BFE模块包括卷积神经网络(CNN)模型。9.根据权利要求8所述的硬件加速器，其中所述CNN模型是残差网络(ResNet)模型。10.根据权利要求1所述的硬件加速器，其中所述丢包掩码生成模块包括Bernoulli掩码发生器，并且所述FA模块包括Monte Carlo模拟模型。11.一种用于检测对象的方法，所述方法包括：在主干特征提取(BFE)模块处：接收包括至少一个对象的图像数据；基于所述图像数据生成多个特征张量，每个特征张量具有不同的尺度；在特征检测(FD)模块处：接收来自所述BFE模块的所述特征张量；执行多次检测经过，每次检测经过包括：向所述特...

【专利技术属性】
技术研发人员：帕塔，
申请(专利权)人：Arm有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人