快速人脸检测方法及装置制造方法及图纸

技术编号:20725737 阅读:26 留言:0更新日期:2019-03-30 17:52
本申请公开了一种快速人脸检测方法及装置。该方法包括在MTCNN算法模型中采用预设P‑Net级联网络并输出候选窗和边界回归向量;以及将上述输出结果输入R‑Net级联网络去除重叠窗并在O‑Net级联网络输出显示目标窗和人脸关键点。本申请解决了人脸检测效率较低的技术问题。通过本申请的方法,加速了MTCNN算法模型的人脸检测速度。此外,通过将SSD人脸检测方法与Viola‑Jones级联结构相融合,既在整体框架上保持了Viola‑Jones级联结构的优越性,又在细节上进一步加快了传统结构的运算速度。

【技术实现步骤摘要】
快速人脸检测方法及装置
本申请涉及人脸识别领域,具体而言,涉及一种人脸检测方法及装置。
技术介绍
随着人脸识别应用市场的逐步扩大,人脸检测作为人脸识别的前序工作起着至关重要的作用,市场需求催生着人脸检测算法在适应复杂网络的同时提高运算速度快。专利技术人发现,常见的人脸检测方法运算速度和运算量由于受到设备和网络复杂程度的影响。针对相关技术中人脸检测效率较低的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种人脸检测方法及装置,以解决人脸检测效率较低的问题。为了实现上述目的,根据本申请的一个方面,提供了一种人脸检测方法。根据本申请的快速人脸检测方法包括:在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量;以及将上述输出结果输入R-Net级联网络去除重叠窗并在O-Net级联网络输出显示目标窗和人脸关键点。进一步地,在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量包括:在所述预设P-Net级联网络中增设锚点框,所述锚点框为多尺度。进一步地,所述预设P-Net级联网络依次包括:一3*3的卷积层、一步长为2的池化层以及至少三个3*3*k*(2+4)的卷积层,其中,k为该位置设置的锚点框种类,参数2为是不是人脸框的概率,参数4为框位置的修正值,将kk设置为1时为正方形。进一步地,在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量包括:在所述预设P-Net级联网络中增设一个位置的长宽比为1:1的锚点框。进一步地,在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量之前还包括:将原图输入所述预设P-Net级联网络。为了实现上述目的,根据本申请的另一方面,提供了一种快速人脸检测装置。根据本申请的快速人脸检测装置包括:级联模块,用于在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量;以及输出模块,用于将上述输出结果输入R-Net级联网络去除重叠窗并在O-Net级联网络输出显示目标窗和人脸关键点。进一步地,所述级联模块还用于,在所述预设P-Net级联网络中增设锚点框,所述锚点框为多尺度。进一步地,所述级联模块还用于在所述预设P-Net级联网络依次设置,一3*3的卷积层、一步长为2的池化层以及至少三个3*3*k*(2+4)的卷积层,其中,k为该位置设置的锚点框种类,参数2为是不是人脸框的概率,参数4为框位置的修正值,将k设置为1时为正方形。进一步地,所述级联模块还用于,在所述预设P-Net级联网络中增设一个位置的长宽比为1:1的锚点框。进一步地,还包括:图像输入模块,用于将原图输入所述预设P-Net级联网络。在本申请实施例中,采用在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量的方式,通过将上述输出结果输入R-Net级联网络去除重叠窗并在O-Net级联网络输出显示目标窗和人脸关键点,达到了避免重复计算的目的,从而实现了加速MTCNN算法模型的人脸检测速度的技术效果,进而解决了人脸检测效率较低的的技术问题。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的快速人脸检测方法示意图;图2是根据本申请实施例的快速人脸检测装置示意图;图3是现有技术中的MTCNN算法模型结构示意图(包括:P-Net、O-Net、R-Net);以及图4是根据本申请实施例的预设P-Net级联网结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。如图1所示,该方法包括如下的步骤S102至步骤S104:步骤S102,在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量;在MTCNN算法模型中,处于最前端的ProposalNetwork(P-Net)负责寻找被选框,然后将其送到后面的RefineNetwork(R-Net)和OutputNetwork(O-Net),继而产生最后的人脸框。通过采用预设P-Net级联网络中不采用图像金字塔,同时不采用滑窗采样模型,而选用anchorbox锚点框减少了重复计算和运行时间。步骤S104,将上述输出结果输入R-Net级联网络去除重叠窗并在O-Net级联网络输出显示目标窗和人脸关键点。将预设P-Net级联网络的输出结果作为R-Net的输入,通过R-Net中通过全连接的方式进行训练,最后通过在O-Net中在去除重叠候选窗口的同时,显示五个人脸关键点定位。从以上的描述中,可以看出,本申请实现了如下技术效果:在本申请实施例中,采用在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量的方式,通过将上述输出结果输入R-Net级联网络去除重叠窗并在O-Net级联网络输出显示目标窗和人脸关键点,达到了避免重复计算的目的,从而实现了加速MTCNN算法模型的人脸检测速度的技术效果,进而解决了人脸检测效率较低的的技术问题。通常现有的人脸检测算法主要是分为两类,第一类是基于传统的Viola-Jones(VJ)的逐级渐进式人脸检测技术,以MTCNN为代表的基于卷积神经网络和VJ结构的算法优点在其运算量较小以及运算速度较快,而且精度能够达到实用的要求,但是由于实际应用时搭载该算法的设备多变,在算力紧张的设备上,由于其采用了滑窗和图像金字塔的方式来寻找目标人脸的位置,速度还是不够理想。另外一类是基于通用物体检测模型,通过anchor而不是滑窗来确定人脸的位置,节省了大部分计算量,代表作为SSD算法,但是由于该结构是基于比较复杂的卷积神经网络,如VGG19,Resnet50等,所以尽管采取了anchor的策略,但是运行速度和运算量还是很大。本申请从上述人脸检测模型和物体检测模型的角度出发,既没有使用图像金字塔、也没有采用滑窗采样模型,很大程度上能够减少重复计算和运行时间。通过全新设计的预设P-Net网络模型,通过加入anchor锚点策略以减少原有MTCNN算法模型中重复计算量。具体地,从图3中可知,最前端的P-Net相当于以步长本文档来自技高网
...

【技术保护点】
1.一种快速人脸检测方法,其特征在于,包括:在MTCNN算法模型中采用预设P‑Net级联网络并输出候选窗和边界回归向量;以及将上述输出结果输入R‑Net级联网络去除重叠窗并在O‑Net级联网络输出显示目标窗和人脸关键点。

【技术特征摘要】
1.一种快速人脸检测方法,其特征在于,包括:在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量;以及将上述输出结果输入R-Net级联网络去除重叠窗并在O-Net级联网络输出显示目标窗和人脸关键点。2.根据权利要求1所述的快速人脸检测方法,其特征在于,在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量包括:在所述预设P-Net级联网络中增设锚点框,所述锚点框为多尺度。3.根据权利要求2所述的快速人脸检测方法,其特征在于,所述预设P-Net级联网络依次包括:一3*3的卷积层、一步长为2的池化层以及至少三个3*3*k*(2+4)的卷积层,其中,k为该位置设置的锚点框种类,参数2为是不是人脸框的概率,参数4为框位置的修正值,将k设置为1时为正方形。4.根据权利要求1所述的快速人脸检测方法,其特征在于,在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗和边界回归向量包括:在所述预设P-Net级联网络中增设一个位置的长宽比为1:1的锚点框。5.根据权利要求1所述的快速人脸检测方法,其特征在于,在MTCNN算法模型中采用预设P-Net级联网络并输出候选窗...

【专利技术属性】
技术研发人员:王宝明张默
申请(专利权)人:北京陌上花科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1