一种基于改进的MTCNN人脸检测方法技术

技术编号：36807148 阅读：11 留言：0更新日期：2023-03-09 00:21

本发明专利技术公开了一种基于改进的MTCNN的人脸检测方法。我们首先在通过一种使用生成对抗网络的超分辨率技术——SRGAN，将低像素图像转换为高像素图像，SRGAN使用反学习方法，结合像素均方误差、VGG高维特征均方误差和针对训练损失的深度卷积网络来实现超分辨率恢复。在原有MTCNN网络结构中创新性地引入了InceptionV2网络结构，提高了网络的学习性能，既保留了原有网络结构的优点，又进一步提高了人脸检测算法的效率和准确性。该模块通过对特征图进行三种不同的卷积(1

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进的MTCNN人脸检测方法

[0001]本专利技术涉及深度学习中的目标检测领域，具体涉及一种改进的MTCNN人脸检测方法。

技术介绍

[0002]人脸检测技术可以在一张图片中检测出人脸的位置和数量。这种技术可以将检测出的人脸输出到人脸识别的模型中，以便于进行人脸识别的相关工作。其还可以应用在视频监控领域，用来捕获视频中的人脸个数。将其应用在相机中，相机通过检测人脸，可以实现自动对焦。
[0003]传统的人脸检测技术存在着检测准确率低和运行速度慢的问题，而基于深度学习的人脸检测技术可以有效的改善这些问题。现有基于深度学习进行人脸检测的技术包括：R
‑
CNN、Fast R
‑
CNN、Faster R
‑
CNN、MTCNN等等，但MTCNN模型因检测准确度较高，同时运行速度较快而在业界受欢迎。
[0004]MTCNN模型是有三个部分组成的：P
‑
net(Proposal net)，R
‑
net(Refine net)和O
‑
net(Output net)；P
‑
net是一个小型的卷积网络，可以快速产生大量候选框并进行初步筛选；R
‑
net的网络结构比P
‑
net增加了一个全连接层，P
‑
net的筛选结果输入到R
‑
net中进一步筛选；O
‑
net比R
‑
net多了一层...

【技术保护点】

【技术特征摘要】
1.一种基于改进的MTCNN人脸检测方法，其特征在于，包括以下步骤：1.进行图像预处理；由于在实际操作中，人脸检测图像受外部因素的影响很大，通过SRGAN(使用生成对抗网络的超分辨率)技术，超分辨率恢复是将低像素图像转换为高像素图像，SRGAN使用反学习方法，结合像素均方误差、VGG高维特征均方误差和针对训练损失的深度卷积网络来实现超分辨率恢复；网络输入不引入任何随机变量，而是直接输入图像，然后输出图像，其结构类似于自动编码器。生成器首先将输入图像编码为高维特征，然后通过残差网络处理特征，最后对恢复的高像素图像进行解码；通过上述图像预处理过程，使图像中的人脸更加清晰，其应用特征更加突出，更易于检测；2.在原有MTCNN网络结构中引入了Inception模块，提高了网络的学习性能，既保留了原有网络结构的优点，又进一步提高了人脸检测算法的效率和准确性。该模块通过对特征图进行三种不同的卷积(1
×
1,3
×
3,5
×
5)来提取更多的特征。不同的卷积检查对不同位置的人脸具有不同的学习效果；使用不同的卷积核进行学习可以更好地达到理想的学习效果；卷积核卷积后提取的特征图和池化层的结果...

【专利技术属性】
技术研发人员：许文波，王树臣，贾海涛，罗欣，常乐，冷庚，
申请(专利权)人：电子科技大学长三角研究院湖州，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人