一种多任务级联卷积神经网络的人脸检测方法及系统技术方案

技术编号:33085625 阅读:38 留言:0更新日期:2022-04-15 10:48
本发明专利技术公开了一种多任务级联卷积神经网络的人脸检测方法及系统,将获取的人脸检测数据集分为训练集和测试集,采用多支路的扩张卷积结构对MTCNN网络中的P网络进行改进,利用训练集分别训练O网络、R网络和改进后的P网络的其中一条支路,得到MTCNN网络的最优参数;以此生成训练好的MTCNN网络;对测试集中的图片进行预处理,将预处理后的图片输入到训练好的MTCNN网络中进行人脸检测,输出检测结果,去除了极其耗时的图像金字塔结构,改之以多支路的扩张卷积代替,不再需要大量搬运数据来完成对图像的多次缩放,也不再需要多次重复的将图像输入到P

【技术实现步骤摘要】
一种多任务级联卷积神经网络的人脸检测方法及系统


[0001]本专利技术属于人脸检测
,具体涉及一种多任务级联卷积神经网络的人脸检测方法及系统。

技术介绍

[0002]目标检测是计算机视觉领域中一项具有挑战性的任务。对于给定一张图像,目标检测需要识别出图像中的指定目标并给出其具体位置。人脸检测是目标检测的一个细分,比起一般的目标检测更加注重多个目标的检测。人脸检测被广泛应用于人脸识别、行人检测、智能监控等领域,为图像和视频的高级语义理解提供有价值的信息,在以图像为主体的智能化数据采集与处理中具有十分重要的作用和影响。传统的人脸检测方法主要是通过对人工设计的特征进行检测,准确率低、速度慢。近年来,采用深度学习的卷积神经网络(CNN)通过自动提取更深层的特征,在人脸检测上取得良好的效果。
[0003]多任务级联卷积神经网络即MTCNN(Multi

task convolutional neural network)是一种通过三层级联结构进行特征提取和分类的高精度、轻量级人脸检测网络。对一张输入的任意大小的图片,它首先本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多任务级联卷积神经网络的人脸检测方法,其特征在于,包括以下步骤:获取人脸检测数据集,将人脸检测数据集分为训练集和测试集;构建MTCNN网络,采用多支路的扩张卷积结构对MTCNN网络中的P网络进行改进,利用训练集分别训练O网络、R网络和改进后的P网络的其中一条支路,得到MTCNN网络的最优参数;生成训练好的MTCNN网络;对测试集中的图片进行预处理,将预处理后的图片输入到训练好的MTCNN网络中进行人脸检测,输出检测结果。2.根据权利要求1所述的一种多任务级联卷积神经网络的人脸检测方法,其特征在于,所述人脸检测数据集采用COCO数据集,以COCO数据集中图片的人脸真实框的几何中心作中心进行裁剪并缩放,分别获得24*24、36*36、48*48三种尺寸的真实人脸图片,计算各个尺寸中真实人脸图片的IOU值,以此标定正样本和负样本,将所有正样本和负样本进行汇总得到训练集;训练集中,24*24尺寸的真实人脸图片用于训练R网络,48*48尺寸的真实人脸图片用于训练O网络,36*36尺寸的真实人脸图片用于训练改进后的P网络的其中一个支路。3.根据权利要求1所述的一种多任务级联卷积神经网络的人脸检测方法,其特征在于,对测试集中的图片进行预处理的过程包括:将图片最短边长统一缩放为300,得到待检测图片;将待检测图片依次通过一个3*3的卷积核和池化层,依次进行初步特征筛选和图片压缩,得到预处理后的图片。4.根据权利要求1所述的一种多任务级联卷积神经网络的人脸检测方法,其特征在于,改进后的P网络包括三条支路,其中,第一支路为改进前的P网络结构,包括两个3*3的卷积核;第二支路中,对两个3*3的卷积核均采用扩张卷积的方法,在两个卷积核中分别增加一个超参数,超参数为扩张率,且两个卷积核采用的扩张率互质,第三支路中,对两个3*3卷积核均采用扩张卷积的方法,在两个卷积核中分别增加一个超参数,超参数为扩张率,且两个卷积核采用的扩张率互质,第三支路采用的扩张率大于第二支路。5.根据权利要求4所述的一种多任务级联卷积神经网络的人脸检测方法,其特征在于,第一支路输出的最终特征图中,每个特征点代表原图12*12大小的区域,用于检测的人脸图片最大为16*16尺寸;第二支路...

【专利技术属性】
技术研发人员:唐贤伦林鑫谢颖罗洪平黄德军谢涛邹密王会明徐梓辉
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1