多尺寸融合人脸检测方法、装置及存储介质制造方法及图纸

技术编号:20045690 阅读:34 留言:0更新日期:2019-01-09 04:24
本发明专利技术实施例提供了一种多尺寸融合人脸检测方法,包括:将初始人脸图片输入VGG16的主干网络,获取常规人脸特征图集及待归一化人脸特征图集;归一化所述待归一化人脸特征图集中的每张特征图,得到归一化人脸特征图集;将所述常规人脸特征图集及归一化人脸特征图集合并,得到最终人脸特征图集;将所述最终人脸特征图集中,任意相邻的两张人脸特征图进行特征融合,得到融合后的多尺寸人脸特征图;对所述多尺寸人脸特征图进行分类,并对每项分类结果进行计分,得分最高的分类结果作为人脸检测结果。本发明专利技术实施例还提供了一种主动交互装置及非暂态可读存储介质,用来实现所述方法。本发明专利技术可以减少图片进行缩放的次数,实现较高的人脸图片检测速率。

【技术实现步骤摘要】
多尺寸融合人脸检测方法、装置及存储介质
本专利技术实施例涉及模式识别
,尤其涉及一种多尺寸融合人脸检测方法、装置及存储介质。
技术介绍
现如今的人脸检测技术大多通过使用图像金字塔技术,对同一张待检测的图片进行不断的放缩,来应对人脸的多尺度的检测难题,这样会浪费大量的时间在不必要的计算上,造成检测效率降低。多尺寸特征融合的人脸检测在不同的尺寸特征上对人脸进行检测。这样可以减少图片进行放缩的次数,以及通过人脸检测器的次数。即可实现较高的检测率,同时检测速度较快,对解决检测效率低下的问题给出了有效启示。因此,如何开发出多尺寸特征的人脸检测方法,就成为业界广泛关注的问题。
技术实现思路
针对现有技术存在的上述问题,本专利技术实施例提供了一种多尺寸融合人脸检测方法、装置及存储介质。一方面,本专利技术实施例提供了一种多尺寸融合人脸检测方法,包括:将初始人脸图片输入VGG16的主干网络,获取常规人脸特征图集及待归一化人脸特征图集;归一化所述待归一化人脸特征图集中的每张特征图,得到归一化人脸特征图集;将所述常规人脸特征图集及归一化人脸特征图集合并,得到最终人脸特征图集;将所述最终人脸特征图集中,任意相邻的两张人脸特征图进行特征融合,得到融合后的多尺寸人脸特征图;对所述多尺寸人脸特征图进行分类,并对每项分类结果进行计分,得分最高的分类结果作为人脸检测结果;其中,所述最终特征图集中的任意两张特征图,尺寸均不相同。另一方面,本专利技术实施例提供了一种主动交互装置及一种非暂态可读存储介质。所述一种主动交互装置包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行所述一种多尺寸融合人脸检测方法。所述一种非暂态可读存储介质存储程序指令,用于执行所述一种多尺寸融合人脸检测方法。本专利技术实施例提供了一种多尺寸融合人脸检测方法、装置及存储介质,通过采用神经网络技术得到特征图集,并将部分特征图归一化,然后采用图片融合技术将多尺寸的人脸图片融合在一起,可以减少图片进行缩放的次数,实现较高的人脸图片检测速率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例中多尺寸融合人脸检测方法的整体流程图;图2是本专利技术实施例中特征融合器结构示意图;图3是本专利技术实施例中多尺寸融合人脸检测效果示意图;图4是本专利技术实施例的硬件装置工作示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。当前的人脸检测技术通过对同一张待检测的图片进行不断的放缩,实现对人脸的多尺度检测难题,这样会造成检测效率较低。由此自然想到,如果能够在不同的尺寸特征上对人脸进行检测,就可以减少图片进行放缩的次数,以及通过人脸检测器的次数,也就可以实现较高的检测率。为了实现上述多尺寸特征的人脸检测技术构想,本专利技术实施例提供了一种多尺寸融合人脸检测方法、装置及存储介质。参见图1,图1是本专利技术实施例中多尺寸融合人脸检测方法的整体流程图,包括:S101:将初始人脸图片输入VGG16的主干网络,获取常规人脸特征图集及待归一化人脸特征图集。所述待归一化人脸特征图集包括:卷积层conv3_3卷积得到的特征图、卷积层conv4_3卷积得到的特征图和卷积层conv5_3卷积得到的特征图。所述常规人脸特征图集包括:卷积层conv_fc7卷积得到的特征图、卷积层conv6_2卷积得到的特征图和卷积层conv7_2卷积得到的特征图。所述卷积层conv3_3卷积得到的特征图,尺寸是所述初始人脸图片的四分之一;所述卷积层conv4_3卷积得到的特征图,尺寸是所述初始人脸图片的八分之一;卷积层conv5_3卷积得到的特征图,尺寸是所述初始人脸图片的十六分之一。所述卷积层conv_fc7卷积得到的特征图,尺寸是所述初始人脸图片的三十二分之一;所述卷积层conv6_2卷积得到的特征图,尺寸是所述初始人脸图片的六十四分之一;所述卷积层conv7_2卷积得到的特征图,尺寸是所述初始人脸图片的一百二十八分之一。S102:归一化所述待归一化人脸特征图集中的每张特征图,得到归一化人脸特征图集。该步骤具体包括:对于卷积层conv3_3卷积得到的特征图,将所述特征图特征值的L2长度归一化到10;对于卷积层conv4_3卷积得到的特征图,将所述特征图特征值的L2长度归一化到8;对于卷积层conv5_3卷积得到的特征图,将所述特征图特征值的L2长度归一化到5。S103:将所述常规人脸特征图集及归一化人脸特征图集合并,得到最终人脸特征图集。S104:将所述最终人脸特征图集中,任意相邻的两张人脸特征图进行特征融合,得到融合后的多尺寸人脸特征图。该步骤具体包括:卷积第n-1层特征图,将所述第n-1层特征图的特征维度,降低至第n层特征图的特征维度的八分之一,得到降维的第n-1层特征图;池化所述降维的第n-1层特征图,将所述降维的第n-1层特征图的尺寸降低至原尺寸的二分之一,得到待融合第n-1层特征图;卷积第n+1层特征图,将所述第n+1层特征图的特征维度,降低至第n层特征图特征维度的八分之一,得到降维的第n+1层特征图;将所述待融合第n-1层特征图与降维的第n+1层特征图进行特征融合,得到融合后的多尺寸特征图。S105:对所述多尺寸人脸特征图进行分类,并对每项分类结果进行计分,得分最高的分类结果作为人脸检测结果。在分类之后,通过SoftNMS将全部人脸分类结果进行合并,得到精确的人脸分类结果。在另一实施例中,分类可以是softmax分类,通过分类器将多尺寸人脸特征图分为四类,第一类是背景类,第二、第三及第四类为正样本类(即,主要包含人脸的分类特征图),通过SoftNMS可以将正样本类进行合并,将大部分的重叠在一起的正样本整合为一个精确的样本。其中,所述最终特征图集中的任意两张特征图,尺寸均不相同。在上述实施例中,特征融合器对于融合不同尺寸的特征图具有重要意义,为了读者能够有效理解本专利技术不同尺寸特征图片的融合机理,有必要对特征融合器的工作情况做出详细的阐述。请参见图2,图2是本专利技术实施例中特征融合器结构示意图,包括:第n-1层特征图201、第n层特征图202及第n+1层特征图203。假设当前的所有特征图的层数记为n(n=1,2,3,4,5,6),对这n层特征图进行融合的时候,将第n-1层特征图201通过一个1x1的卷积层(即1x1conv,类似不再赘述)改变特征维度至第n层特征图202的1/8,然后通过一个2x2的maxpooling层(即池化层),降低其平面尺寸为原来的1/2。将第n+1层特征图203经过1x1的卷积层改变特征维度至第n层特征图202的1/8,然后通过双本文档来自技高网...

【技术保护点】
1.一种多尺寸融合人脸检测方法,其特征在于,包括:将初始人脸图片输入VGG16的主干网络,获取常规人脸特征图集及待归一化人脸特征图集;归一化所述待归一化人脸特征图集中的每张特征图,得到归一化人脸特征图集;将所述常规人脸特征图集及归一化人脸特征图集合并,得到最终人脸特征图集;将所述最终人脸特征图集中,任意相邻的两张人脸特征图进行特征融合,得到融合后的多尺寸人脸特征图;对所述多尺寸人脸特征图进行分类,并对每项分类结果进行计分,得分最高的分类结果作为人脸检测结果;其中,所述最终特征图集中的任意两张特征图,尺寸均不相同。

【技术特征摘要】
1.一种多尺寸融合人脸检测方法,其特征在于,包括:将初始人脸图片输入VGG16的主干网络,获取常规人脸特征图集及待归一化人脸特征图集;归一化所述待归一化人脸特征图集中的每张特征图,得到归一化人脸特征图集;将所述常规人脸特征图集及归一化人脸特征图集合并,得到最终人脸特征图集;将所述最终人脸特征图集中,任意相邻的两张人脸特征图进行特征融合,得到融合后的多尺寸人脸特征图;对所述多尺寸人脸特征图进行分类,并对每项分类结果进行计分,得分最高的分类结果作为人脸检测结果;其中,所述最终特征图集中的任意两张特征图,尺寸均不相同。2.根据权利要求1所述的方法,其特征在于,所述待归一化人脸特征图集包括:卷积层conv3_3卷积得到的特征图、卷积层conv4_3卷积得到的特征图和卷积层conv5_3卷积得到的特征图。3.根据权利要求1所述的方法,其特征在于,所述常规人脸特征图集包括:卷积层conv_fc7卷积得到的特征图、卷积层conv6_2卷积得到的特征图和卷积层conv7_2卷积得到的特征图。4.根据权利要求2所述的方法,其特征在于,所述卷积层conv3_3卷积得到的特征图,尺寸是所述初始人脸图片的四分之一;所述卷积层conv4_3卷积得到的特征图,尺寸是所述初始人脸图片的八分之一;卷积层conv5_3卷积得到的特征图,尺寸是所述初始人脸图片的十六分之一。5.根据权利要求3所述的方法,其特征在于,所述卷积层conv_fc7卷积得到的特征图,尺寸是所述初始人脸图片的三十二分之一;所述卷积层conv6_2卷积得到的特征图,尺寸是所述初始人脸图片的六十四分之一;所述卷积层conv7_2卷积得到的特征图...

【专利技术属性】
技术研发人员:郭秋杉董远白洪亮熊风烨
申请(专利权)人:北京飞搜科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1