当前位置: 首页 > 专利查询>辉达公司专利>正文

边界框的生成制造技术

技术编号:36900442 阅读:20 留言:0更新日期:2023-03-18 09:20
用于识别图像(100、200)中对象的边界框(104、204、206、208、210、306、308、504、506、508)的装置、系统(1400、1600、1700、2200、2400、2900、4000、4300)和技术。在至少一个实施例中,使用至少部分地基于对象大小的交并比阈值在图像(100、200)中确定边界框(104、204、206、208、210、306、308、504、506、508)。508)。508)。

【技术实现步骤摘要】
【国外来华专利技术】边界框的生成


[0001]至少一个实施例涉及用于生成围绕图像内的对象的边界框的处理资源。例如,至少一个实施例涉及至少部分地基于图像内的对象的大小来区分可供选择的边界框提案的处理器或计算系统。

技术介绍

[0002]计算机视觉领域是一个重要的发展领域,可以实现许多任务的自动化。许多计算机视觉系统的一个重要问题是视野内对象的定位和识别。通常,通过在图像中的对象周围生成边界框来部分解决此问题。边界框是图像区域的框、圆、标记或指示,其指示图像内对象的位置。准确的边界框通常通过提供关于对象在边界框内的位置的更准确的信息来帮助控制系统。因此,改进边界框生成技术是一个重要问题。
附图说明
[0003]图1示出了在至少一个实施例中的围绕图像内的车辆的边界框的示例;
[0004]图2示出了在至少一个实施例中的图像内的对象的候选边界框的集的示例;
[0005]图3示出了在至少一个实施例中为一对边界框确定交并比(“IOU”)的示例;
[0006]图4示出了在至少一个实施例中过滤对象的候选边界框的集的代码的示例;
[0007]图5示出了在至少一个实施例中的大对象的边界框的集的示例;
[0008]图6示出了在至少一个实施例中的小对象的边界框的集的示例;
[0009]图7示出了在至少一个实施例中基于图像内对象的大小过滤对象的候选边界框的集的代码的示例;
[0010]图8示出了用于至少一个实施例的显示边界框生成的准确性的测试结果的示例;
[0011]图9示出了在至少一个实施例中的作为由计算机系统的一个或更多个处理器执行的结果而使计算机系统过滤候选边界框的集的过程的示例;
[0012]图10A示出了根据至少一个实施例的推理和/或训练逻辑;
[0013]图10B示出了根据至少一个实施例的推理和/或训练逻辑;
[0014]图11示出了根据至少一个实施例的神经网络的训练和部署;
[0015]图12示出了根据至少一个实施例的示例数据中心系统;
[0016]图13A示出了根据至少一个实施例的自主车辆的示例;
[0017]图13B示出了根据至少一个实施例的图13A的自主车辆的相机位置和视野的示例;
[0018]图13C是根据至少一个实施例的示出图13A的自主车辆的示例系统架构的框图;
[0019]图13D是根据至少一个实施例的示出用于一个或更多个基于云的服务器与图13A的自主车辆之间进行通信的系统的图;
[0020]图14是根据至少一个实施例的示出计算机系统的框图;
[0021]图15是根据至少一个实施例的示出计算机系统的框图;
[0022]图16示出了根据至少一个实施例的计算机系统;
[0023]图17示出了根据至少一个实施例的计算机系统;
[0024]图18A示出了根据至少一个实施例的计算机系统;
[0025]图18B示出了根据至少一个实施例的计算机系统;
[0026]图18C示出了根据至少一个实施例的计算机系统;
[0027]图18D示出了根据至少一个实施例的计算机系统;
[0028]图18E和图18F示出了根据至少一个实施例的共享编程模型;
[0029]图19示出了根据至少一个实施例的示例性集成电路和相关的图形处理器。
[0030]图20A

图20B示出了根据至少一个实施例的示例性集成电路和相关联的图形处理器。
[0031]图21A和图21B示出了根据至少一个实施例的附加的示例性图形处理器逻辑;
[0032]图22示出了根据至少一个实施例的计算机系统;
[0033]图23A示出了根据至少一个实施例的并行处理器;
[0034]图23B示出了根据至少一个实施例的分区单元;
[0035]图23C示出了根据至少一个实施例的处理集群;
[0036]图23D示出了根据至少一个实施例的图形多处理器;
[0037]图24示出了根据至少一个实施例的多图形处理单元(GPU)系统;
[0038]图25示出了根据至少一个实施例的图形处理器;
[0039]图26是根据至少一个实施例的示出用于处理器的处理器微架构的框图;
[0040]图27示出了根据至少一个实施例的深度学习应用程序处理器;
[0041]图28是根据至少一个实施例的示出了示例神经形态处理器的框图;
[0042]图29示出了根据一个或更多个实施例的图形处理器的至少部分;
[0043]图30示出了根据一个或更多个实施例的图形处理器的至少部分;
[0044]图31示出了根据一个或更多个实施例的图形处理器的至少部分;
[0045]图32是根据至少一个实施例的示出了图形处理器的图形处理引擎的框图;
[0046]图33是根据至少一个实施例的示出了图形处理器核心的至少部分的框图;
[0047]图34A和图34B示出了根据至少一个实施例的线程执行逻辑,其包括图形处理器核心的处理元件的阵列。
[0048]图35示出了根据至少一个实施例的并行处理单元(“PPU”);
[0049]图36示出了根据至少一个实施例的通用处理集群(“GPC”);
[0050]图37示出了根据至少一个实施例的并行处理单元(“PPU”)的存储器分区单元;
[0051]图38示出了根据至少一个实施例的流式多处理器;
[0052]图39是根据至少一个实施例的高级计算管线的示例数据流图;
[0053]图40是根据至少一个实施例的用于在高级计算管线中训练、适应、实例化和部署机器学习模型的示例系统的系统图;
[0054]图41包括根据至少一个实施例的用于处理成像数据的高级计算管线4010A的示例图示;
[0055]图42A包括根据至少一个实施例的支持超声设备的虚拟仪器的示例数据流图;
[0056]图42B包括根据至少一个实施例的支持CT扫描仪的虚拟仪器的示例数据流图;
[0057]图43A示出了根据至少一个实施例的用于训练机器学习模型的过程的数据流图;
以及
[0058]图43B是根据至少一个实施例的利用预训练的注释模型来增强注释工具的客户端

服务器架构的示例图示。
具体实施方式
[0059]本文档描述了创建围绕图像内的一个或更多个对象的准确边界框的系统和方法。在至少一个实施例中,通过相机、摄像机或成像系统获取图像。在至少一个实施例中,图像由执行存储在非暂时性计算机可读存储器中的可执行指令的计算机系统处理,这使得计算机系统识别围绕图像内的对象的多个潜在边界框。在至少一个实施例中,为每个对象生成多个候选边界框。在至少一个实施例中,为每个候选边界框产生相关联的置信度度量。在至少一个实施例中,选择具有最高置信度的边界框作为相关联对象的边界框。在至少一个实施例中,将所选边界框与其他边界框进行比较以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种处理器,包括:一个或更多个电路,其用于使用一个或更多个神经网络以至少部分地基于一个或更多个对象的大小,从与一个或更多个图像内的所述一个或更多个对象对应的多个边界框中选择一个或更多个边界框。2.根据权利要求1所述的处理器,其中:作为单个边界框与所述一个或更多个边界框的交并比大于阈值的结果,不选择所述单个边界框;以及所述阈值至少部分地基于所述一个或更多个对象的所述大小。3.根据权利要求1所述的处理器,其中基于与所述一个或更多个对象相关联的边界框确定所述一个或更多个对象的所述大小。4.根据权利要求1所述的处理器,其中至少部分地基于所述一个或更多个对象与用于获取所述一个或更多个图像的相机之间的距离确定所述一个或更多个对象的所述大小。5.根据权利要求1所述的处理器,其中:所述多个边界框中的每个边界框具有相关联的置信度度量;以及用于单个对象的边界框至少部分地基于与所述边界框相关联的置信度度量被选择。6.根据权利要求1所述的处理器,其中通过对所述多个边界框执行针对与所述多个边界框中的每个边界框相关联的置信度度量的非极大值抑制来选择所述一个或更多个边界框。7.根据权利要求1所述的处理器,其中:所述一个或更多个对象包括第一车辆;以及所述一个或更多个图像是由第二车辆上的相机获取的。8.根据权利要求1所述的处理器,其中所述一个或更多个图像包括多个对象,并且所选择的一个或更多个边界框包括用于所述多个对象中的每一者的边界框。9.根据权利要求1所述的处理器,其中:所述一个或更多个神经网络检测所述一个或更多个对象;以及所述一个或更多个神经网络生成所述多个边界框。10.一种计算机实现的确定对象的边界框的方法,包括:至少部分地基于一个或更多个对象的大小,从与一个或更多个图像内的所述一个或更多个对象对应的多个边界框中选择一个或更多个边界框。11.根据权利要求10所述的计算机实现的方法,其中:作为单个边界框与所述一个或更多个边界框的交并比大于阈值的结果,不选择所述单个边界框;以及所述阈值至少部分地基于所述一个或更多个对象的所述大小。12.根据权利要求10所述的计算机实现的方法,其中基于与所述一个或更多个对象相关联的边界框确定所述一个或更多个对象的所述大小。13.根据权利要求10所述的计算机实现的方法,其中至少部分地基于所述一个或更多个对象与用于获取所述一个或更多个图像的相机之间的距离确定所述一个或更多个对象的所述大小。14.根据权利要求10所述的计算机实现的方法,其中:所述多个边界框中的每个边界框具有相关联的置信度度量;以及
用于单个对象的边界框至少部分地基于与所述边界框相关联的置信度度量被选择。15.根据权利要求10所述的计算机实现的方法,其中通过针对与所述多个边界框中的每个边界框相关联的置信度度量过滤所述多个边界框来选择所述一个或更多个边界框。16.根据权利要求10所述的计算机实现的方法,其中:所述一个或更多个对象包括人;以及所述一个或更多个图像是由安装在车辆上的相机获取的。17.根据权利要求10所述的计算机实现的方法,其中所述一个或更多个图像包括多个对象,并且所选择的一个或更多个边界框包括用于所述多个对象中的每一者的边界框...

【专利技术属性】
技术研发人员:沈迤淳蒋万里权丁铉李思一吴相旼朴旻雨
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1