The present disclosure is a method and device for the detection of a target object. The method comprises the following steps: recognition steps, the N layer will be full of convolutional network FCN model image input cascade, identifying the probability map detected the target object in the N layer corresponding to the bounding box; determine the steps according to the probability of the first n layer corresponding to the value of the the bounding box and the non maximal suppression of NMS the bounding box are combined; the step of determining the original area, the bounding box combined to get the original image corresponding to the image processing area in the article; n+1 layer of the FCN model of the original area of the input by the cascade of iterative implementation the identification process, the bounding box to determine the steps and the original region; the L layer in the cascade until FCN model, output of the target image to be processed in the position. This public detection speed is faster and the detection rate is higher.
【技术实现步骤摘要】
目标对象的检测方法及装置
本公开涉及目标检测领域,尤其涉及一种目标对象的检测方法及装置。
技术介绍
相关技术中,采用CascadeCNN模型进行人脸检测时,采用滑动窗口的方法,来查找人脸。当滑动的次数增多或窗口变大时,跟踪过程所需的存储空间会极具上升。由于相邻的滑动窗口之间会产生重叠区域。因此,在检测过程中做了大量的无用功,检测速度慢。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种目标对象的检测方法及装置。根据本公开实施例的第一方面,提供一种目标对象的检测方法,包括:识别步骤,将待处理图像输入级联的全卷积网络FCN模型的第n层,识别得到所检测的目标对象在所述第n层对应的概率图,所述级联的FCN模型包括L层FCN,L为大于或等于2的整数,所述n为从1到L的整数;包围盒确定步骤,根据所述第n层对应的概率图上各概率值,得到各包围盒,并采用非极大值抑制NMS将各包围盒进行合并;原图区域确定步骤,将合并后的包围盒在所述待处理图像上得到对应的原图区域;将所得到的所述原图区域输入所述级联的FCN模型的第n+1层,迭代地执行所述识别步骤、所述包围盒确定步骤和所述原图区域确 ...
【技术保护点】
一种目标对象的检测方法,其特征在于,包括:识别步骤,将待处理图像输入级联的全卷积网络FCN模型的第n层,识别得到所检测的目标对象在所述第n层对应的概率图,所述级联的FCN模型包括L层FCN,L为大于或等于2的整数,所述n为从1到L的整数;包围盒确定步骤,根据所述第n层对应的概率图上各概率值,得到各包围盒,并采用非极大值抑制NMS将各包围盒进行合并;原图区域确定步骤,将合并后的包围盒在所述待处理图像上得到对应的原图区域;将所得到的所述原图区域输入所述级联的FCN模型的第n+1层,迭代地执行所述识别步骤、所述包围盒确定步骤和所述原图区域确定步骤;直至在所述级联的FCN模型的第L ...
【技术特征摘要】
1.一种目标对象的检测方法,其特征在于,包括:识别步骤,将待处理图像输入级联的全卷积网络FCN模型的第n层,识别得到所检测的目标对象在所述第n层对应的概率图,所述级联的FCN模型包括L层FCN,L为大于或等于2的整数,所述n为从1到L的整数;包围盒确定步骤,根据所述第n层对应的概率图上各概率值,得到各包围盒,并采用非极大值抑制NMS将各包围盒进行合并;原图区域确定步骤,将合并后的包围盒在所述待处理图像上得到对应的原图区域;将所得到的所述原图区域输入所述级联的FCN模型的第n+1层,迭代地执行所述识别步骤、所述包围盒确定步骤和所述原图区域确定步骤;直至在所述级联的FCN模型的第L层,输出所述目标对象在所述待处理图像的位置。2.根据权利要求1所述的方法,其特征在于,还包括:针对所述目标对象进行训练,得到级联的卷积神经网络CNN模型,所述级联的CNN模型包括多层CNN;将所述级联的CNN模型转化为所述级联的FCN模型,所述级联的FCN模型包括多层FCN。3.根据权利要求1或2所述的方法,其特征在于,还包括:将所述待处理图像按照不同比例缩放,得到多个缩放后的图像;将所述多个缩放后的图像输入所述级联的FCN模型,迭代地执行识别步骤、包围盒确定步骤和原图区域确定步骤,得到所述目标对象在所述多个缩放后的图像中对应的位置;采用NMS对识别出的所述多个缩放后的图像中的位置进行聚合,得到所述目标对象在所述待处理图像的位置。4.根据权利要求3所述的方法,其特征在于,将所述多个缩放后的图像输入所述级联的FCN模型,迭代地执行识别步骤、包围盒确定步骤和原图区域确定步骤,得到所述目标对象在所述多个缩放后的图像中对应的位置,包括:所述识别步骤包括:将尺度为M*N的图像输入所述级联的FCN模型的第n层,识别得到所述第n层对应的X*Y的概率图,所述尺度为M*N的图像由所述待处理图像缩放得到的图像,所述X等于M*St,Y等于N*St,所述St为步长,所述n为从1到L的整数;所述包围盒确定步骤包括:根据第n层对应的概率图上的概率值大于设定阈值的点,得到S个包围盒B,并采用NMS将S个包围盒B进行合并;所述原图区域确定步骤包括:将合并后的S个包围盒在所述尺度为M*M的图像上得到对应的S个原图区域B1;将所得到的S个原图区域B1输入所述级联的FCN模型的第n+1层,迭代地执行所述识别步骤、所述包围盒确定步骤和所述原图区域确定步骤,直至在所述级联的FCN模型的第L层,输出所述目标对象在所述尺度为M*M的图像中对应的概率图和位置。5.一种目标对象的检测装置,其特征在于,包括:识别模块,用于将待处理图像输入级联的全卷积网络FCN模型的第n层,识别得到所检测的目标对象在所述第n层对应的概率图,所述级联的FCN模型包括L层FCN,L为大于或等于2的整数,所述n为从1到L的整数;包围盒确定模块,用于根据所述第n层对应的概率图上各概率值,得到各包围盒,并采用非极大值抑制NMS将各包围盒进行合并;原图区域确定模块,用于将合并后的包围盒在所...
【专利技术属性】
技术研发人员:陈志军,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。