一种基于图像识别的滑动窗口框选方法及终端技术

技术编号:29675811 阅读:22 留言:0更新日期:2021-08-13 21:58
本发明专利技术公开了一种基于图像识别的滑动窗口框选方法及终端,采用滑动窗口对待识别图像进行分类识别,得到大于第一置信度阈值的检测框,从其中获取置信度最大的第一检测框并标记为目标检测框,将与其的重叠区域面积比例大的所有第二检测框标记为待选检测框;将其余检测框重复执行上述步骤,直至所有待选检测框都标记为待选检测框或者目标检测框;将所有待选检测框分别去除与对应的目标检测框的重叠区域之后的子检测框进行分类识别以得到子检测框的置信度,将子检测框的置信度大于第二置信度阈值的待选检测框的标记修改为目标检测框。本发明专利技术不仅能够删除冗余的检测框,还能尽可能的保证所有的目标物均能被检测到,即能准确的框选出所有目标物。

【技术实现步骤摘要】
一种基于图像识别的滑动窗口框选方法及终端
本专利技术涉及图像处理
,特别涉及一种基于图像识别的滑动窗口框选方法及终端。
技术介绍
图像识别技术是人工智能的一个重要领域。它是指对图像进行对象识别,以识别各种不同模式的目标和对像的技术。对于图像来说,每个物体所对应的图像都有其自己的特征,对于人类大脑来说,当视觉信息通过视网膜进入大脑时,视觉皮层将感觉输入转换成连贯的感知,这些连贯的感知可以理解为是物体的心理表征,并由大脑内的神经元进行不同的物体区分。基于此,现有的图像识别技术中越来越多的应用到借鉴人类的神经网络算法。在此基础上,在一些应用场景下,还需要将物体识别之后并进行框选出来,比如在一张图像上有多个人脸,现在要将所有的人脸都框选出来,此时,采用滑动窗口对进行人脸识别时,有可能会得到多个符合置信度阈值的检测框,但有的检测框可能包括多个目标人脸,也有可能多个检测框为同一目标人脸,即现有算法在针对一张图像存在多个目标物时无法准确的框选出所有目标物。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于图像识别的滑动窗口框选方法及终端,以准确的框选出所有目标物。为了解决上述技术问题,本专利技术采用的技术方案为:一种基于图像识别的滑动窗口框选方法,包括步骤:步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;步骤S3、将未被标记为所述待选检测框或者所述目标检测框中的其余检测框重复执行步骤S2,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框。为了解决上述技术问题,本专利技术采用的另一种技术方案为:一种基于图像识别的滑动窗口框选终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;步骤S3、将未被标记为所述待选检测框或者所述目标检测框中的其余检测框重复执行步骤S2,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框。本专利技术的有益效果在于:一种基于图像识别的滑动窗口框选方法及终端,在采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框时,基于置信度最大的第一检测框作为目标检测框,并将与第一检测的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框进行保留而非删除,在后续去除对应的目标检测框的重叠区域之后的子检测框进行分类识别而得到的置信度大于第二置信度阈值时,则认为待选检测框还存在有目标检测框之外的出目标物,因此将其作为目标检测框,从而避免目标物靠的太近而导致被遮挡的目标物没有被检测到;并将未被标记为待选检测框或者目标检测框中的其余检测框重复执行上述步骤,以得到目标检测框,从而不仅能够删除冗余的检测框,还能尽可能的保证所有的目标物均能被检测到,即能准确的框选出所有目标物。附图说明图1为本专利技术实施例的一种基于图像识别的滑动窗口框选方法的流程示意图;图2为本专利技术实施例的一种基于图像识别的滑动窗口框选终端的结构示意图。标号说明:1、一种基于图像识别的滑动窗口框选终端;2、处理器;3、存储器。具体实施方式为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。请参照图1,一种基于图像识别的滑动窗口框选方法,包括:步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;步骤S3、将未被标记为所述待选检测框或者所述目标检测框中的其余检测框重复执行步骤S2,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框,所述第二置信度阈值小于所述第一置信度阈值。从上述描述可知,本专利技术的有益效果在于:在采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框时,基于置信度最大的第一检测框作为目标检测框,并将与第一检测的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框进行保留而非删除,在后续去除对应的目标检测框的重叠区域之后的子检测框进行分类识别而得到的置信度大于第二置信度阈值时,则认为待选检测框还存在有目标检测框之外的出目标物,因此将其作为目标检测框,从而避免目标物靠的太近而导致被遮挡的目标物没有被检测到;并将未被标记为待选检测框或者目标检测框中的其余检测框重复执行上述步骤,以得到目标检测框,从而不仅能够删除冗余的检测框,还能尽可能的保证所有的目标物均能被检测到,即能准确的框选出所有目标物。进一步地,所述步骤S3具体包括:从未被标记为所述待选检测框或者所述目标检测框中的其余检测框中获取置信度最大的第三检测框,将所述待选检测框和所述其余检测框中筛选出与所述第三检测框的重叠区域面积比例大于重叠率阈值的所有第四检测框标记为待选检测框,依次类推,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框。从上述描述可知,若将待选检测框不与后续剩余最大的检测框进行一个重叠区域的判断,则待选检测框去除之前对应的目标检测框本文档来自技高网
...

【技术保护点】
1.一种基于图像识别的滑动窗口框选方法,其特征在于,包括:/n步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;/n步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;/n步骤S3、将未被标记为所述待选检测框或者所述目标检测框中的其余检测框重复执行步骤S2,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;/n步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框,所述第二置信度阈值小于所述第一置信度阈值。/n

【技术特征摘要】
1.一种基于图像识别的滑动窗口框选方法,其特征在于,包括:
步骤S1、采用滑动窗口对待识别图像进行分类识别之后,得到多个大于第一置信度阈值的检测框以及每一个检测框的置信度;
步骤S2、从所有检测框中获取置信度最大的第一检测框,将与所述第一检测框的重叠区域面积比例大于重叠率阈值的所有第二检测框标记为待选检测框,将所述第一检测框标记为目标检测框,并记录每一个所述待选检测框所对应的所述目标检测框;
步骤S3、将未被标记为所述待选检测框或者所述目标检测框中的其余检测框重复执行步骤S2,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框;
步骤S4、将所有所述待选检测框分别去除与对应的所述目标检测框的重叠区域之后的子检测框进行分类识别以得到所述子检测框的置信度,判断所述子检测框的置信度是否大于第二置信度阈值,若是,则将所述待选检测框的标记修改为所述目标检测框,否则删除所述待选检测框,所述第二置信度阈值小于所述第一置信度阈值。


2.根据权利要求1所述的一种基于图像识别的滑动窗口框选方法,其特征在于,所述步骤S3具体包括:
从未被标记为所述待选检测框或者所述目标检测框中的其余检测框中获取置信度最大的第三检测框,将所述待选检测框和所述其余检测框中筛选出与所述第三检测框的重叠区域面积比例大于重叠率阈值的所有第四检测框标记为待选检测框,依次类推,直至所有所述待选检测框都标记为所述待选检测框或者所述目标检测框。


3.根据权利要求1所述的一种基于图像识别的滑动窗口框选方法,其特征在于,所述步骤S4之后还包括:
步骤S5、从所述目标检测框的第一边上逐步向着对应的第二边的方向缩小第二预设大小并得到缩小后的子目标框的置信度,若连续多次缩小后的子目标框的置信度小于所述目标检测框的置信度,则执行步骤S6,否则执行步骤S7;
步骤S6、从所述目标检测框的第一边上逐步向着对应的第二边的方向扩大所述第二预设大小并得到扩大后的子目标框的置信度,将扩大后的子目标框的置信度与目标检测框的置信度进行比较并进行不断的扩大,直至当前次数区间内扩大后的子目标框的置信度大于前后两个次数区间扩大后的子目标框的置信度为止,从当前次数区间内扩大后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8,所述次数区间为连续的预设次数组成的区间;
步骤S7、继续往同一方向进行缩小并进行前后两个次数区间的置信度比较,直至当前次数区间内缩小后的子目标框的置信度大于前后两个次数区间缩小后的子目标框的置信度为止,从当前次数区间内缩小后的子目标框中选择置信度最高的子目标框作为下一次缩小或扩大的所述目标检测框之后执行步骤S8;
步骤S8、对所述目标检测框的其他三个边分别作为第一边以分别执行步骤S4至步骤S7,将最终经过扩大或缩小后所得到的子目标框所在区域确定为最终的目标检测框。


4.根据权利要求3所述的一种基于图像识别的滑动窗口框选方法,其特征在于,所述预设次数为[2,4]。


5.根据权利要求1所述的一种基于图像识别的滑动窗口框选方法,其特征在于,所述步骤S4之后还包括:对不同的目标物的目标检测框采用不同的颜色进行显示。


6.一种基于图像识别...

【专利技术属性】
技术研发人员:谢衍
申请(专利权)人:北博厦门智能科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1