用于对象检测的系统和方法技术方案

技术编号：18843983 阅读：44 留言：0更新日期：2018-09-05 08:57

公开了一种用于对象检测的方法，包括：将待检测的对象类别分组成构成阶层式树状结构的多个对象集群；获得图像和用于所获得的图像的至少一个边界框；从所述阶层式树状结构的根集群到叶集群，通过针对所述阶层式树状结构的每个所述集群分别训练的CNN来评估每个边界框中的对象，以确定所述对象的最深叶集群；以及将所确定的最深叶集群处的对象类别标签输出为所述对象的预测对象类别标签。在本公开内还公开了一种用于对象检测的系统。

System and method for object detection

A method for object detection is disclosed, including: grouping the object class to be detected into a plurality of object clusters constituting a hierarchical tree structure; obtaining an image and at least one boundary frame for the obtained image; and from the root cluster to the leaf cluster of the hierarchical tree structure, by targeting the hierarchical tree structure. The CNN trained by each of the clusters of the structure evaluates the objects in each boundary box to determine the deepest leaf cluster of the objects, and outputs the object class label at the deepest leaf cluster to the predicted object class label of the objects. In the present disclosure, a system for object detection is also disclosed.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于对象检测的系统和方法
本公开涉及用于对象检测的方法和系统。
技术介绍
微调是指从在另一相关任务上预先训练的参数初始化用于目标任务的模型参数的方法。已发现从在大型图像网络(ImageNet)数据集上预先训练的深度模型的微调对于许多视觉任务(例如，跟踪、分段、对象检测、动作识别和事件检测)取得了目前先进水平的性能。当微调用于对象检测的深度模型时，对多个对象类别的检测由多项任务构成。对每个类别的检测是一项任务。在应用阶段，不同对象类别的检测评分是独立的。且对结果的评估也独立于这些对象类别。现有的深度学习方法一并考虑所有类别/任务并学习单个特征表示。但是，此共享的表示对于所有对象类别并非是最好的。如果学习到的表示能够聚焦于具体类别，例如哺乳动物，那么学习到的表示在描述这些具体类别时将表现得更好。深度学习在许多工作中应用于类属对象检测。现有工作主要聚焦于开发新的深度模型和更好的对象检测流程。这些工作针对所有对象类别使用一个特征表示。当使用手工制作的特征时，针对所有对象类别使用相同的特征提取机制。但是，该相同的特征提取机制对于每个对象类别并非不最适合的，这自然会降低针对一些对象类别的准确性。
技术实现思路
下文呈现对本公开的简化概述以便提供对本公开的一些方面的基本理解。此
技术实现思路
部分并非本公开的详尽综述。其既不旨在指出本公开的重要要素或关键要素，也不旨在划定本公开的具体实施例的任何范围，或权利要求书的任何范围。其唯一目的是以简化形式呈现本公开的一些构思来作为稍后呈现的更详细描述的序言。在一方面中，公开了一种用于对象检测的方法，包括：将待检测的对象的对象类别分组成构...

【技术保护点】
1.一种用于对象检测的方法，包括：将待检测的对象的对象类别分组成构成阶层式树状结构的多个对象集群；获得图像和用于所获得的图像的至少一个边界框；从所述阶层式树状结构的根集群到叶集群，通过针对所述阶层式树状结构的每个所述对象集群分别训练的CNN来评估每个边界框中的对象，以确定所述对象的最深叶集群；以及将所确定的最深叶集群处的对象类别标签输出为所述对象的预测对象类别标签。

【技术特征摘要】
【国外来华专利技术】1.一种用于对象检测的方法，包括：将待检测的对象的对象类别分组成构成阶层式树状结构的多个对象集群；获得图像和用于所获得的图像的至少一个边界框；从所述阶层式树状结构的根集群到叶集群，通过针对所述阶层式树状结构的每个所述对象集群分别训练的CNN来评估每个边界框中的对象，以确定所述对象的最深叶集群；以及将所确定的最深叶集群处的对象类别标签输出为所述对象的预测对象类别标签。2.根据权利要求1所述的方法，其中，将待检测的对象的对象类别分组成构成阶层式树状结构的多个对象集群包括：从训练集获得包含待检测的对象的训练图像和用于所述训练图像的至少一个边界框；通过经训练的CNN，提取每个所述边界框中的对象的特征；以及根据所提取的特征之间的相似性，将每个所述边界框中的对象的对象类别分配到构成所述阶层式树状结构的所述对象集群中。3.根据权利要求2所述的方法，其中，将每个所述边界框中的对象的对象类别分配到构成所述阶层式树状结构的所述对象集群中是基于视觉相似性进行的。4.根据权利要求1所述的方法，其中，从所述阶层式树状结构的根集群到叶集群，通过针对所述阶层式树状结构的每个所述对象集群分别训练的CNN来评估每个边界框中的对象，以确定所述对象的最深叶集群包括：通过针对父集群训练的CNN从所获得的图像提取特征；根据所提取的特征计算所述对象针对所述父集群的每个子集群的分类评分；将所述对象接收到具有大于阈值的分类评分的子集群中，且所述子集群在下一评估中用作父集群，其中，不针对除了所述子集群以外的其它集群进行评估；重复执行所述提取、所述计算和所述接收的步骤，直到所述对象集群定位于最后层级中或不存在大于所述阈值的分类评分为止。5.根据权利要求4所述的方法，其中，所述方法还包括：训练分别用于每个所述对象集群的CNN，所述训练包括：对分别用于每个所述对象集群的CNN以其父集群的CNN进行初始化；通过所述提取、所述计算、所述接收的步骤评估每个边界框中的对象，直到所述对象集群定位于最后层级中或不存在大于所述阈值的分类评分为止，以确定该对象的最深叶集群；将所确定的最深叶集群处的对象类别标签输出为该对象的预测对象类别标签；基于所述预测对象类别标签与训练图像中的该对象的真实对象类别标签之间的差异对用于每个集群的CNN进行微调；以及重复所述初始化、所述评估、所述输出和所述微调的步骤直到所述预测对象类别标签的准确性收敛为止。6.根据权利要求5所述的方法，其中，通过针对父集群训练的CNN从所获得的图像提取特征包括：通过所述边界框裁剪所获得的图像；使所裁剪的图像弯曲成经训练的CNN所需的预定大小；以及通过经训练的CNN从弯曲的图像提取特征。7.根据权利要求4所述的方法，其中，所述分类评分表示所述对象属于一个集群中的对象类别的可能性。8.根据权利要求1所述的方法，其中，将所确定的最深叶集群处的对象类别标签输出为所述对象的预测对象类别标签包括：确定所确定的叶集群是所述阶层式树状结构的端集群；以及将所述叶集群处的对象类别标签输出为所述对象的预测对象类别标签。9.一种用于对象检测的系统，包括：分组单元，所述分组单元用于将待检测的对象的对象类别分组成构成阶层式树状结构的多个对象集群；以及预测单元，所述预测单元用于：获得图像和所获得的图像的至少一个边界框；从所述阶层式树状结构的根集群到叶集群，通过针对所述阶层式树状结构的每个所述对象集群分别训练的CNN来评估每个边界框中的对象，以确定所述对象的最深叶集群；以及将所确定的最深叶集群处的对象类别标签输出为所述对象的预测对象类别标签。10.根据权利要求9所述的系统，其中，所述分组单元还用于：从训练集获得包含待检测的对象的训练图像和用于所述训练图像的至少一个边界框；通过经训练的CNN，提取每个所述边界框中的对象的特征；以及根据所提取的特征之间的相似性，将每个所述边界框中的对象的对象类别分配到构成所述阶层式树状结构的所述对象集群中。11.根据权利要求10所述的系统，其中，将每个所述边界框中的对象的对象类别分配到构成所述阶层式树状结构的所述对象集群中是基于视觉相似性进行的。12.根据权利要求9所述的系统，其中，所述预测单元用于：通过针对父集群训练的CNN从所获得的图像提取特征；根据所提取的特征计算所述对象针对所述父集群的每个子集群的分类评分；将所述对象接收到具有大于阈值的分类评分的子集群中，且子集群在下一评估中用作父集群，其中，不针对除了所述子集群以外的其它集群进行评估；重复执行所述提取、所述计算和所述接收的步骤，直到所述对象集群定位于最后层级中或不存在大于所述阈值的分类评分为止。13.根据...

【专利技术属性】
技术研发人员：王晓刚，欧阳万里，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人