针对图像中的对象的自动边界框生成制造技术

技术编号:24290411 阅读:50 留言:0更新日期:2020-05-26 20:24
本申请的各实施例涉及针对图像中的对象的自动边界框生成。本文中描述的一个或多个实施例包括一种确定针对图像中的对象的边界框的计算机实现的方法。该方法包括使用第一算法确定针对第一图像中的对象的标签,以及基于第一图像、通过从选择的方向裁剪第一图像来生成图像集合。该方法还包括使用第一算法确定针对该集合中的每个图像的标签,以及从该集合去除图像,从而使得剩余图像具有与初始标签匹配的标签。该方法还包括确定针对该集合的关键图像,关键图像是来自该集合的、具有超过阈值的置信度得分的最小图像。此外,该方法包括基于第一图像的与关键图像重叠的一部分的周长来确定第一图像中的对象的边界框。

Automatic bounding box generation for objects in images

【技术实现步骤摘要】
针对图像中的对象的自动边界框生成
本专利技术涉及计算技术,并且特别地涉及用于针对图像中的对象的自动边界框生成的技术。在一个或多个示例中,具有针对图像中的对象而被标识的边界框的这样的图像被用作训练数据集。
技术介绍
在过去的几年中,基于数字图像的对象检测得到了越来越多的关注。例如,对象检测系统当前正在高级驾驶员辅助系统(ADAS)、电子商务应用和各种其他领域中被实现。传统的对象检测方法通常涉及两个阶段。首先,在检测阶段中,包含目标对象的候选的图像区域被检测或定位。然后,在识别阶段中,这样的区域被进一步分析以识别具体内容。然而,这些传统的对象检测系统和方法通常需要大量的训练数据、计算资源,检测速度较慢并且有时可能不准确。针对感兴趣对象的具有边界框的训练数据不容易找到,并且其生成需要付出努力。
技术实现思路
本文中描述的一个或多个实施例包括一种确定针对图像中的对象的边界框的计算机实现的方法。该方法包括使用第一算法确定针对第一图像中的对象的标签,以及基于第一图像、通过从选择的方向裁剪(crop)第一图像来生成图像集合。该方法还包括使用第一算法确定针对该集合中的每个图像的标签,以及从该集合去除图像,从而使得图像的剩余部分具有与初始标签匹配的标签。该方法还包括确定针对该集合的关键图像,关键图像来自该集合的、具有超过阈值的置信度得分的最小图像。此外,该方法包括基于第一图像的与关键图像重叠的一部分的周长来确定针对第一图像中的对象的边界框。根据本专利技术的一个或多个实施例,一种系统包括图像数据库,该图像数据库具有包含一个或多个对象的图像,以及标识图像中的一个或多个对象的标签。该系统还包括处理器,该处理器被配置为使用方法从图像数据库确定针对第一图像中的对象的边界框,该方法包括使用第一算法确定针对第一图像中的对象的标签,以及基于第一图像,通过从选择的方向裁剪第一图像来生成图像集合。该方法还包括使用第一算法确定针对该集合中的每个图像的标签,以及从该集合去除图像,从而使得剩余图像具有与初始标签匹配的标签。该方法还包括确定针对该集合的关键图像,关键图像是来自该集合的、具有超过阈值的置信度得分的最小图像。此外,该方法包括基于第一图像的与关键图像重叠的一部分的周长来确定针对第一图像中的对象的边界框。根据本专利技术的一个或多个实施例,一种计算机程序产品包括计算机可读存储介质,该计算机可读存储介质具有存储于其上的程序指令,该程序指令由一个或多个处理设备可执行以执行方法,该方法包括:使用第一算法确定针对第一图像中的对象的标签,以及基于第一图像、通过从选择的方向裁剪第一图像来生成图像集合。该方法还包括使用第一算法确定针对该集合中的每个图像的标签,以及从该集合去除图像,从而使得剩余图像具有与初始标签匹配的标签。该方法还包括确定针对该集合的关键图像,关键图像是来自该集合的、具有超过阈值的置信度得分的最小图像。此外,该方法包括基于第一图像的与关键图像重叠的一部分的周长来确定针对第一图像中的对象的边界框。通过本专利技术的技术实现了附加的特征和优点。本专利技术的其他实施例和方面在本文中被详细描述,并且被视为所要求保护的专利技术的一部分。为了更好地理解本专利技术的优点和特征,参考说明书和附图。应当理解,技术方案在应用中不限于以下描述中被阐述的或在附图中被示出的构造的细节和组件的布置。这些技术方案还能够具有除了所描述的那些之外的其他实施例,并且能够以各种方式来实践和执行。另外,应当理解,本文中采用的措词和术语以及摘要是出于描述的目的,而不应当被认为是限制性的。这样,本领域技术人员将认识到,本公开所基于的概念可以容易地用作设计用于实现当前描述的技术方案的几个目的的其他结构、方法和系统的基础。附图说明参考以下附图和描述,将能够更好地理解贯穿本文档描述的示例。图中的组件不一定按比例绘制。此外,在附图中,贯穿不同的视图,相似的附图标记指代相应的部分。图1描绘了被用于利用边界框标记训练图像的现有系统;图2示出了用于在图像中生成边界框的示例现有系统;图3描绘了根据本专利技术的一个或多个实施例的用于自动地生成训练图像集合的系统的框图;图4描绘了针对根据本专利技术的一个或多个实施例的自动地生成训练图像集合的方法的流程图;以及图5描绘了本专利技术的一个或多个实施例的示例场景的视觉表示。具体实施方式本文中参考相关附图描述了本专利技术的各种实施例。可以在不脱离本专利技术的范围的情况下设计本专利技术的替代实施例。在以下描述和附图中,阐述了元件之间的各种连接和位置关系(例如,上方、下方、相邻等)。除非另有说明,否则这些连接和/或位置关系可以是直接的或间接的,并且本专利技术并不意图在这方面进行限制。因此,实体的耦合可以是指直接或间接耦合,并且实体之间的位置关系可以是直接或间接位置关系。此外,本文中描述的各种任务和过程步骤可以被并入具有本文中未详细描述的附加步骤或功能的更全面的程序或过程中。以下定义和缩写用于解释权利要求和说明书。如本文中使用的,术语“包括(comprises)”、“包括(comprising)”、“包括(includes)”、“包括(including)”、“具有(has)”、“具有(having)”、“包含(contains)”或“包含(containing)”或其任何其他变型旨在覆盖非排他性的包括。例如,包括一系列元素的组合物、混合物、过程、方法、制品或装置不必仅限于这些元素,而是可以包括未明确列出的或者这样的组合物、混合物、过程、方法、制品或装置所固有的其他元素。此外,术语“示例性”在本文中用来表示“用作示例、实例或说明”。本文中描述为“示例性”的任何实施例或设计不必被解释为比其他实施例优选或有利。设计。术语“至少一个”和“一个或多个”可以被理解为包括大于或等于1的任何整数,即1、2、3、4等。术语“多个”可以被理解为包括大于或等于2的任何整数,即2、3、4、5等。术语“连接”可以同时包括间接“连接”和直接“连接”。术语“大约”、“基本上”、“近似”及其变体旨在包括与基于提交申请时可用的设备的特定数量的测量相关联的误差程度。例如,“大约”可以包括给定值的±8%或5%或2%的范围。为了简洁起见,在本文中可以或可以不详细描述与制造和使用本专利技术的各方面有关的常规技术。特别地,用以实现本文中描述的各种技术特征的计算系统和特定计算机程序的各个方面是公知的。因此,为了简洁起见,很多传统的实现细节在本文中仅被简要提及,或者被完全省略而不提供公知的系统和/或过程细节。应当注意,本文中的描述是指电子图像中的对象检测,因此,本文中对“图像”的这样的引用是指电子图像,其可以按照诸如JPEG、PNG等任何电子格式被存储。在计算技术中,可以使用在可编程计算机上运行的人工神经网络(ANN)或机器学习算法来执行自动地检测图像中的对象以及标记图像中的这样的检测到的对象。为了使ANN能够按预期操作,必须对ANN进行训练。在这种情况中,为了训练ANN以检测和标记图像中的对象,必须利用已经与针对这些图像中的对象的边本文档来自技高网...

【技术保护点】
1.一种确定针对图像中的对象的边界框的计算机实现的方法,所述方法包括:/n使用第一算法确定针对第一图像中的对象的标签;/n确定选择的方向:/n基于所述第一图像来生成图像集合,其中所述图像集合中的每个图像通过从所述选择的方向裁剪所述第一图像而被生成;/n使用所述第一算法确定针对所述图像集合中的每个图像的标签;/n从所述图像集合去除图像,从而使得所述图像集合中剩余的每个图像具有与针对所述第一图像中的所述对象的所述标签匹配的标签;以及/n确定针对所述图像集合的关键图像,其中所述关键图像是来自所述图像集合的、具有超过阈值的置信度得分的最小图像,所述最小图像是在所述选择的方向中具有最小尺寸的图像;以及/n基于所述第一图像的与所述关键图像重叠的一部分的周长来确定针对所述第一图像中的所述对象的边界框。/n

【技术特征摘要】
20181119 US 16/194,8171.一种确定针对图像中的对象的边界框的计算机实现的方法,所述方法包括:
使用第一算法确定针对第一图像中的对象的标签;
确定选择的方向:
基于所述第一图像来生成图像集合,其中所述图像集合中的每个图像通过从所述选择的方向裁剪所述第一图像而被生成;
使用所述第一算法确定针对所述图像集合中的每个图像的标签;
从所述图像集合去除图像,从而使得所述图像集合中剩余的每个图像具有与针对所述第一图像中的所述对象的所述标签匹配的标签;以及
确定针对所述图像集合的关键图像,其中所述关键图像是来自所述图像集合的、具有超过阈值的置信度得分的最小图像,所述最小图像是在所述选择的方向中具有最小尺寸的图像;以及
基于所述第一图像的与所述关键图像重叠的一部分的周长来确定针对所述第一图像中的所述对象的边界框。


2.根据权利要求1所述的计算机实现的方法,其中所述选择的方向是来自包括右方向、左方向、上方向和下方向的一组方向的一个方向。


3.根据权利要求2所述的计算机实现的方法,其中针对所述第一图像中的所述对象的所述边界框基于所述第一图像的与针对每个方向的每个关键图像重叠的所述一部分的所述周长而被确定。


4.根据权利要求1所述的计算机实现的方法,其中所述边界框是沿着所述选择的方向的第一边界框,所述方法还包括:确定沿着第二选择的方向的第二边界框。


5.根据权利要求4所述的计算机实现的方法,其中所述第一边界框针对所述对象,并且所述第二边界框针对所述第一图像中的另一对象。


6.根据权利要求1所述的计算机实现的方法,其中所述第一图像是二维(2D)图像。


7.根据权利要求1所述的计算机实现的方法,其中所述第一图像是n维图像。


8.一种系统,包括:
图像数据库,所述图像数据库包括多个图像以及多个标签,所述多个图像包含一个或多个对象,所述多个标签标识所述图像中的所述一个或多个对象;
...

【专利技术属性】
技术研发人员:B·巴塔查尔吉J·R·史密斯M·格林伯格
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1