一种基于ELUs改进的MTCNN人脸检测方法技术

技术编号:32639228 阅读:12 留言:0更新日期:2022-03-12 18:14
本发明专利技术涉及一种基于ELUs改进的MTCNN人脸检测方法,属于图像识别领域。该方法包括以下步骤:S1:利用图像金字塔技术对输入模型的数据进行处理,生成一组图片;S2:将图像金字塔处理后的数据调整尺寸为12*12后,传入P

【技术实现步骤摘要】
一种基于ELUs改进的MTCNN人脸检测方法


[0001]本专利技术属于图像识别领域,涉及一种基于ELUs改进的MTCNN人脸检测方法。

技术介绍

[0002]目前基于深度学习的人脸检测算法主要分为基于目标检测方法的人脸检测算法和专业的人脸检测算法。基于目标检测方法的人脸检测算法主要包含三大类:基于候选窗口的Two Stage系列目标检测算法、基于回归的One Stage目标检测算法和基于目标检测算法改进的人脸检测算法,其中基于候选窗口的Two Stage系列目标检测算法和基于回归的One Stage目标检测算法用于检测人脸这类小目标时,与专业的人脸检测算法相比在检测效果上还是存在差距;基于目标检测算法改进的人脸检测算法虽然检测准确率非常高,但相较于级联CNN的算法,具有上百兆的模型规模,且运行时间较长受到硬件设备的制约。
[0003]基于级联CNN系列的专业人脸检测算法在结构上较为简单,模型规模较小,在实际的场景中已有广泛应用,但正是由于该类算法的结构简单,对于人脸检测样本的信息利用不完全,所以该类人脸检测算法的检测准确率还有提高空间。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种基于ELUs改进的MTCNN人脸检测方法。
[0005]为达到上述目的,本专利技术提供如下技术方案:
[0006]一种基于ELUs改进的MTCNN人脸检测方法,该方法包括以下步骤:
[0007]S1:利用图像金字塔技术对输入模型的数据进行处理,生成一组图片;
[0008]S2:将图像金字塔处理后的数据调整尺寸为12*12后,传入P

Net,生成人脸候选框,再对boundingbox进行回归和NMS计算;
[0009]S3:将输出结果Resize为24*24后,通过R

Net对输入数据进行计算后生成boundingbox,并对boundingbox进行regression和NMS计算;
[0010]S4:将输出结果Resize为48*48后,通过O

Net对输入数据进行计算后生成boundingbox和人脸关键点定位,并对其进行回归计算和NMS计算,得到人脸检测输出结果。
[0011]可选的,所述S1中,使用图像金字塔按照缩放系数对图片进行缩放,每次缩小为原来的0.709倍大小。
[0012]可选的,所述S2中,P

Net包括一个输入层、三个卷积层和两个输出层,其中第一个卷积层所采用的卷积核为3
×
3,最大池化的卷积核为2
×
2。
[0013]可选的,所述S3中,R

Net包含1个输入层、3个卷积层、1个全连接层和2个输出层,其中前两个卷积层所采用的卷积核为3
×
3,最大池化的卷积核为2
×
2,第三个卷积层的卷积核为2
×
2,全卷积层的尺寸为128。
[0014]可选的,所述S4中,R

Net包含1个输入层、4个卷积层、1个全连接层和3个输出层,其中第一个卷积层所采用的卷积核为3
×
3,最大池化的卷积核为2
×
2;第二个卷积层所采用的卷积核为3
×
3,最大池化的卷积核为3
×
3;第三个卷积层的卷积核为3
×
3,最大池化的
卷积核为2
×
2;最后一个卷积层的卷积核为2
×
2,全卷积层的尺寸为256。
[0015]可选的,在所述方法中,将人脸分类任务、人脸边框回归任务和人脸关键点三种任务融合,增加人脸特征之间的相关性,提升人脸检测准确率,融合的方式是将三种任务所对应的损失函数进行加权求和,根据任务的贡献度不同设置相应的权值,以保证模型检测的效果;
[0016]其中P

Net与R

Net的损失函数如公式(1)所示,O

Net的损失函数如公式(2)所示:
[0017]total_loss_value=L
det
+0.5L
box
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0018]total_loss_value=L
det
+0.5L
box
+0.5L
landmark
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0019]其中,L
det
、L
box
和L
det
分别为三种任务,其相应的损失函数如下:
[0020](1)人脸分类任务:判别输入图像中是否包含人脸的任务;对于每一个样本i用交叉熵函数来表示损失值,如公式(3)所示:
[0021][0022]其中,p
i
为人脸出现的概率,为该区域真实标签;
[0023](2)人脸边框回归任务:对人脸候选框bounding box进行边框回归计算,得到原图中boundingbox的位置,利用平方损失函数来量化模型预测boundingbox与真实的bounding box之间的差异,计算方式如式(4)所示:
[0024][0025]其中,为预测的boundingbox坐标,为实际的boundingbox坐标;
[0026](3)人脸关键点定位任务:用平方损失函数来量化模型预测人脸关键点landmark与真实的landmark之间的差异,计算方式如公式(5)所示:
[0027][0028]其中,为模型预测到的landmark位置,为实际landmark位置;
[0029]对于S1、S2与S3中使用ELUs函数对网络模型进行激活,函数如公式(6)所示:
[0030][0031]本专利技术的有益效果在于:本专利技术所达到的有益效果是:本专利技术针对网络模型参数对人脸检测方法影响,结合了MTCNN算法的级联结构思想,去除P

Net和R

Net的网络的人脸关键点输出任务,并修改其损失函数的同时,引入ELUs作为激活函数。通过测试,相比于传统的MTCNN网络,本专利技术在FDDB数据集上有很好的检测效果,检测准确率达到了95.5%。
[0032]本专利技术在MTCNN的基础上进行优化设计,选择不同任务的融合与更加有效的激活函数,使其提出的改进方法具有更高的人脸检测准确率。
[0033]本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
[0034]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于ELUs改进的MTCNN人脸检测方法,其特征在于:该方法包括以下步骤:S1:利用图像金字塔技术对输入模型的数据进行处理,生成一组图片;S2:将图像金字塔处理后的数据调整尺寸Resize为12*12后,传入P

Net,生成人脸候选框bounding box,再对bounding box进行回归regression和NMS计算;S3:将输出结果Resize为24*24后,通过R

Net对输入数据进行计算后生成bounding box,并对bounding box进行regression和NMS计算;S4:将输出结果Resize为48*48后,通过O

Net对输入数据进行计算后生成bounding box和人脸关键点定位facial landmark localization,并对其进行回归计算和NMS计算,得到人脸检测输出结果。2.根据权利要求1所述的一种基于ELUs改进的MTCNN人脸检测方法,其特征在于:所述S1中,使用图像金字塔按照缩放系数对图片进行缩放,每次缩小为原来的0.709倍大小。3.根据权利要求2所述的一种基于ELUs改进的MTCNN人脸检测方法,其特征在于:所述S2中,P

Net包括一个输入层、三个卷积层和两个输出层,其中第一个卷积层所采用的卷积核为3
×
3,最大池化的卷积核为2
×
2。4.根据权利要求3所述的一种基于ELUs改进的MTCNN人脸检测方法,其特征在于:所述S3中,R

Net包含1个输入层、3个卷积层、1个全连接层和2个输出层,其中前两个卷积层所采用的卷积核为3
×
3,最大池化的卷积核为2
×
2,第三个卷积层的卷积核为2
×
2,全卷积层的尺寸为128。5.根据权利要求4所述的一种基于ELUs改进的MTCNN人脸检测方法,其特征在于:所述S4中,R

Net包含1个输入层、4个卷积层、1个全连接层和3个输出层,其中第一个卷积层所采用的卷积核为3
×
3,最大池化的卷积核为2
×
2;第二个卷积层所采用的卷积核为3
×
3,最大池...

【专利技术属性】
技术研发人员:王华东张莉娟
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1