【技术实现步骤摘要】
对象检测的系统和方法
本申请涉及用于图像处理的系统和方法,尤其涉及检测图像中的对象的系统和方法。
技术介绍
随着人工智能(AI)应用(例如,人脸识别、智能监控摄像机)的出现和普及,人工智能对象检测技术,特别是基于深度学习的对象检测技术得到了迅速发展。人工智能对象检测技术可以识别和/或分类图像中的对象,并通过绘制边界框来定位图像中的对象。然而,边界框通常是矩形框。对于不规则的对象或相对于图像倾斜的对象(例如,安全带),边界框(例如,矩形框)可能包括背景。在一些情况下,边界框可能包括比对象更多的背景,这样不能准确定位对象。因此,期望提供用于确定倾斜对象的边界的人工智能系统和方法,其可以实现倾斜对象的精确定位。
技术实现思路
本申请的目的在于提供用于对象检测的系统和方法。该系统和方法可以确定对象的边界,从而实现该对象的准确定位。为达到上述专利技术目的,本申请提供的技术方案如下:在本申请的一个方面,提供了一种对象检测的方法。所述方法可以包括获取包括目标对象的图像,并通过将所述图像输入卷积神经网络(CNN)来生成特征图。所述方法还包括基于所述特征图确定候选框,并基于所述候选框和所述特征图确定池化候选框。所述方法还包括通过分类器将所述池化候选框分类为一个或以上对象类别或背景类别。所述一个或以上对象类别可以包括所述目标对象的类别,并且所述池化候选框可以包括对应于所述目标对象的一个或以上池化候选框。所述一个或以上池化候选框中的每个池化候选框可以具有至少两个角。对于与所述目标对象相对应的所述一个或以 ...
【技术保护点】
1.一种对象检测的方法,其特征在于,包括:/n获取包含目标对象的图像;/n通过将所述图像输入卷积神经网络来生成特征图;/n基于所述特征图确定候选框;/n基于所述候选框和所述特征图确定池化候选框;/n通过分类器将所述池化候选框分类为一个或以上对象类别或背景类别,所述一个或以上对象类别包括所述目标对象的类别,所述池化候选框包括对应于所述目标对象的一个或以上池化候选框,所述一个或以上池化候选框的每个池化候选框具有至少两个角;以及/n对于与所述目标对象相对应的所述一个或以上池化候选框的每个池化候选框,/n根据所述池化候选框的所述至少两个角的每个角的位置确定所述对应角的至少两个截取策略;/n通过根据所述至少两个截取策略中的一个截取所述至少两个角中的每个角来修剪所述池化候选框;/n根据所述截取的至少两个角来识别所述修剪的池化候选框的边界;以及/n将所述边界映射到所述图像以确定所述目标对象的边界。/n
【技术特征摘要】
1.一种对象检测的方法,其特征在于,包括:
获取包含目标对象的图像;
通过将所述图像输入卷积神经网络来生成特征图;
基于所述特征图确定候选框;
基于所述候选框和所述特征图确定池化候选框;
通过分类器将所述池化候选框分类为一个或以上对象类别或背景类别,所述一个或以上对象类别包括所述目标对象的类别,所述池化候选框包括对应于所述目标对象的一个或以上池化候选框,所述一个或以上池化候选框的每个池化候选框具有至少两个角;以及
对于与所述目标对象相对应的所述一个或以上池化候选框的每个池化候选框,
根据所述池化候选框的所述至少两个角的每个角的位置确定所述对应角的至少两个截取策略;
通过根据所述至少两个截取策略中的一个截取所述至少两个角中的每个角来修剪所述池化候选框;
根据所述截取的至少两个角来识别所述修剪的池化候选框的边界;以及
将所述边界映射到所述图像以确定所述目标对象的边界。
2.根据权利要求1所述的对象检测的方法,其特征在于,所述卷积神经网络包括一个或以上卷积层和一个或以上池化层,并且没有全连接层。
3.根据权利要求1所述的对象检测的方法,其特征在于,所述候选框是根据区域建议网络确定的。
4.根据权利要求3所述的对象检测的方法,其特征在于,所述区域建议网络包括至少一个回归层和至少一个分类层,并且确定所述候选框进一步包括:
在所述特征图上滑动滑动窗口;
在每个滑动窗口位置所述滑动窗口与所述特征图的一个子区域重合,
将所述特征图的所述子区域映射到多维特征向量;
通过将所述子区域的中心像素映射到所述图像的像素来生成锚点,所述锚点对应于所述图像中的一组锚点框,所述锚点框的每个与尺度和宽高比相关;
将所述多维特征向量分别送入所述至少一个回归层和所述至少一个分类层,其中
所述至少一个回归层用于进行边界框回归以确定对应于所述锚点框的一组初始候选框,所述至少一个回归层的输出包括所述初始候选框的每个初始候选框的四个坐标值,以及
所述至少一个分类层用于确定所述初始候选框的每个初始候选框的类别,所述类别为前景或背景,所述至少一个分类层的输出包括所述初始候选框的每个初始候选框为前景的第一得分和为背景的第二得分;以及
基于至少两个初始候选框的每个初始候选框为前景的所述第一得分和为背景的所述第二得分和所述至少两个初始候选框的每个候选框的四个坐标值,选择所述至少两个初始候选框的一部分作为所述候选框。
5.根据权利要求4所述的对象检测的方法,其特征在于,选择所述至少两个初始候选框的一部分作为所述候选框包括:
使用非极大抑制选择所述候选框。
6.根据权利要求1至5中任一项所述的对象检测的方法,其特征在于,所述池化候选框对应于规范大小,确定所述池化候选框进一步包括:
将所述候选框映射到所述特征图,以确定候选特征图;以及
通过在所述候选特征图上执行池化来确定所述池化候选框。
7.根据权利要求1所述的对象检测的方法,其特征在于,所述至少两个角包括左上角、右上角、左下角和右下角,其中
所述左上角的所述至少两个截取策略包括向右截取、向下截取、向右下截取、目标位置或错误中的至少一个;
所述右上角的所述至少两个截取策略包括向左截取、向下截取、向左下截取、目标位置或错误中的至少一个;
所述左下角的所述至少两个截取策略包括向右截取、向上截取、向右上截取、目标位置或错误中的至少一个;以及
所述右下角的所述至少两个截取策略包括向左截取、向上截取、向左上截取、目标位置或错误中的至少一个。
8.根据权利要求7所述的对象检测的方法,其特征在于,进一步包括:
当所述至少两个角中的一个角对应于目标位置截取策略时,停止截取所述角。
9.根据权利要求7所述的对象检测的方法,其特征在于,截取所述至少两个角中的每个角包括:
基于所述池化候选框确定所述至少两个角中的每个角的截取方向和截取长度,其中所述至少两个角中的每个角的所述截取方向限于所述对应角的所述至少两个截取策略中的一个;以及
基于所述截取方向和所述截取长度截取所述至少两个角中的每个角。
10.根据权利要求7所述的对象检测的方法,其特征在于,通过截取所述至少两个角中的每个角来修剪所述池化候选框包括:
执行一次或以上迭代;
在所述一次或以上迭代的每次迭代中,
根据所述池化候选框,从所述至少两个截取策略中确定所述至少两个角的每个角的截取策略;
确定所述至少两个角中的一个角是否对应于错误截取策略;
响应于确定所述至少两个角中的每个角不对应于所述错误截取策略,确定所述至少两个角中的每个角是否对应于目标位置截取策略;
响应于确定所述至少两个角中的至少一个角不对应于所述目标位置截取策略,根据所述至少两个角的所述至少一个角的所述确定的截取策略,截取所述至少两个角的所述至少一个角;
基于所述截取的至少两个角,执行边界映射以确定矩形框;以及
将所述矩形框调整为规范大小;以及
响应于确定所述至少两个角的每个角对应于所述目标位置截取策略,停止截取所述至少两个角。
11.根据权利要求10所述的对象检测的方法,其特征在于,进一步包括:
响应于确定所述至少两个角中的至少一个角对应于所述错误截取策略,放弃所述池化候选框。
12.根据权利要求1所述的对象检测的方法,其特征在于,进一步包括:
确定与所述目标对象相对应的一个或以上边界;
确定所述一个或以上边界的每个边界与真实框之间的交并比;以及
将所述一个或以上边界中具有最大交并比的边界确定为对应于所述目标对象的目标边界。
13.根据权利要求1所述的对象检测的方法,其特征在于,所述目标对象的所述边界是四边形框。
14.一种对象检测的系统,其特征在于,包括获取模块、特征图确定模块、候选框确定模块、池化候选框确定模块、分类模块和边界确定模块;
所述获取模块用于获取包含目标对象的图像;
所述特征图确定模块用于通过将所述图像输入卷积神经网络来生成特征图;
所述候选框确定模块用于基于所述特征图确定候选框;
所述池化候选框确定模块用...
【专利技术属性】
技术研发人员:赵元,辛颖,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。