【技术实现步骤摘要】
【国外来华专利技术】对象检测
[0001]本专利技术涉及图像中的对象检测。
技术介绍
[0002]近年来,依赖于大规模手动注释数据库,对象检测取得了重大进展。在许多现实场景中,构建和注释这类数据库非常耗时且不切实际。
[0003]这些缺点促使开发弱监督和小样本(few
‑
shot)的对象检测方法。这两种策略都有前景,但与强监督策略相比仍有所欠缺。
[0004]问题的症结可以归因于依靠由图像级标签或仅由少数注释示例提供的弱训练信号无法学习稳定的对象特征,从而通常导致检测不完整或过大。
[0005]弱监督对象检测(weakly
‑
supervised object detection,WSOD)的一些现有工作依赖于多实例学习(multiple
‑
instance learning,MIL)框架,该框架旨在从全局组级标签对个体实例进行分类。在这些场景中,每个图像都表示为多个边界框提议(通常通过传统方法提取,如Uijlings,J.R.,Van De Sande,K.E.,G ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于对图像中的区域进行分类的设备(401),其特征在于,所述设备包括:输入端,用于接收第一图像集合(512),以及对于所述第一集合(512)的每个图像,定义所述图像的一个或多个区域和所述区域的分类的数据,和第二图像集合(513),以及对于所述第二集合(513)的每个图像,所述图像的分类;处理器(404),用于通过以下步骤训练第一机器学习算法(106、514)以对图像中的特征进行分类:使用所述第一算法(106、514)处理所述第一集合(512)和所述第二集合(513)的所述图像,以估计所述图像中的特征区域和每个特征区域的分类,并根据针对所述第一集合(512)和所述第二集合(513)的所述图像接收的分类来训练所述第一算法(106、514)。2.根据权利要求1所述的设备(401),其特征在于,所述处理器(404)用于训练所述第一机器学习算法(106、514),从而为所述第二集合(513)的所述图像中的至少一些图像形成针对这些图像估计的所述分类的置信度估计。3.根据权利要求1或2所述的设备(401),其特征在于,所述处理器(404)用于训练第二机器学习算法(110、515)以对图像中的区域进行分类,所述处理器(404)用于在训练所述第二算法(110、515)时使用所述第二集合的所述图像的子集,使得所述子集的所述图像中的每个图像的权重在训练所述第二算法(110、515)时取决于相应图像的估计置信度,所述第二集合的所述图像的子集由所述第一算法(106、514)进行分类。4.根据上述权利要求中任一项所述的设备(401),其特征在于,所述第一算法(106、514)包括用于估计图像中的特征区域的第一子部分和用于估计特征区域的分类的第二子部分,并且所述处理器(404)用于训练所述第一子部分以估计所述第二集合(513)的图像中的特征区域,所述特征区域由所述第二子部分分类,以匹配所述相应图像的接收到的分类。5.根据上述权利要求中任一项所述的设备(401),其特征在于,所述第二算法(110、515)用于训练所述第二子部分。6.根据上述权利要求中任一项所述的设备(401),其特征在于,所述处理器(404)用于通过多次将所述第一图像集合(512)和所述第二图像集合(513)中的至少一些作为所述第一算法(106、514)的输入来训练所述第一算法(106、514)。7.根据上述权利要求中任一项所述的设备(401),其特征在于,所述第一算法(106、514)根据存储的权重集合运行,并且所述处理器(404)用于根据所述第一算法(106、514)在对所述第一集合(512)和所述第二集合(513)的所述图像进行分类时的性能训练这些...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。