一种基于改进YOLOv5的实时小人脸检测方法技术

技术编号:37548047 阅读:31 留言:0更新日期:2023-05-12 16:24
本发明专利技术请求保护一种基于改进YOLOv5的实时小人脸检测方法,属于计算机视觉领域。包括以下步骤:步骤1.采用YOLOv5作为小人脸检测的基础框架,该YOLOv5小人脸检测模型中加入了SKAttention,通过动态计算每个卷积核得到通道的权重,动态的将各个卷积核的结果进行融合,可以让神经网络更加关注小人脸,提升真实场景中小人脸检测的精度。步骤2.设计了小人脸特征增强模块,将特征图进行上采样处理,使得特征图继续扩大,同时将浅层特征图与深层特征图进行融合。步骤3.为了满足实时性要求,采用YOLOv5模型,并将主干特征提取网络C3替换为更轻量的ShuffleNetV2网络,以实现网络模型的轻量化,平衡速度和精度。量化,平衡速度和精度。量化,平衡速度和精度。

【技术实现步骤摘要】
Dense Face Localisation inthe Wild;CenterFace:Joint Face Detection and Alignment Using Faceas Point。

技术实现思路

[0011]本专利技术旨在解决以上现有技术的问题。提出了一种基于改进YOLOv5的实时小人脸检测方法。本专利技术的技术方案如下:
[0012]一种基于改进YOLOv5的实时小人脸检测方法,其包括以下步骤:
[0013]步骤1:将人脸数据集划分为训练集和测试集,对训练集进行包括以下预处理:数据集的清洗:检查数据集中的图片和标签文件是否完整,否则删除多余的图片和标签文件,同时将长宽比太小的锚框删除,并且在删除后,检查下是否存在空的标注文件,如果有,也删除;根据Kmeans聚类算法得到自适应锚框;
[0014]步骤2:基于YOLOv5的小人脸检测模型,引入SK选择性卷积核注意力,通过动态计算每个卷积核得到通道的权重,动态的将各个卷积核的结果进行融合;
[0015]步骤3:设计小人脸特征增强模块,小人脸特征增强模块是:在第17层后,继续对特征图进行上采样处理,使得特征图继续扩大,同时第20层获取到的特征图与第2层的特征图进行融合(concat),以获得更大的特征图进行小目标的检测,将特征图进行上采样处理,使得特征图继续扩大,同时将浅层特征图与深层特征图进行融合;
[0016]步骤4:采用YOLOv5模型,并将主干特征提取网络C3替换为ShuffleNetV2网络;
[0017]步骤5:将训练好的小人脸检测深度学习模型应用于真实场景的小人脸检测。
[0018]进一步的,所述步骤1:将人脸数据集划分为训练集和测试集,对训练集进行预处理,根据聚类算法得到自适应锚框,具体包含以下步骤:
[0019]A1、对训练集中的图片数据进行数据增强,通过平移、旋转、改变图片的宽高比、调整饱和度在内的操作,增加样本数据;
[0020]A2、通过聚类算法,对训练集中的真实锚框进行聚类分析,得到精确的锚框作为小人脸检测网络的预定值。
[0021]进一步的,所述A2、通过聚类算法,对训练集中的真实锚框进行聚类分析,得到精确的锚框作为小人脸检测网络的预定值,具体包括:
[0022]yolov5生成anchors中不仅仅使用了k

means聚类,还使用了Genetic Algorithm遗传算法,在k

means聚类的结果上进行mutation变异。
[0023]1.读取训练集中每张图片的宽高以及所有锚框的宽高
[0024]2.将每张图片中宽高的最大值等比例缩放到指定大小img_size
[0025]3.将锚框从相对坐标改成绝对坐标(乘以缩放后的宽高)
[0026]4.筛选锚框,保留宽高都大于等于两个像素的锚框
[0027]5.使用k

means聚类得到n个锚框(掉k

means包涉及一个白化操作)
[0028]6.使用遗传算法随机对锚框的宽高进行变异,如果变异后效果变得更好,就将变异后的结果赋值给锚框,如果变异后效果变差就跳过,默认变异1000次7.将最终变异得到的锚框返回。
[0029]进一步的,所述步骤2:基于YOLOv5的小人脸检测模型,引入SK注意力,通过动态计算每个卷积核得到通道的权重,动态的将各个卷积核的结果进行融合,具体包括以下步骤:
[0030]B1、对于任何给定的特征图X∈R
H
×
W
×
c
,H、W、c分别表示图像的宽、高、通道数,R表示特征图,经过两次变换和和和均由深度卷积组成,归一化和激活函数依次运行;传统的卷积5*5被空洞卷积替换扩张为2,卷积核大小为3*3;不同分支不同的卷积核处理输入X特征,得到多分支的处理后的特征图;
[0031]B2、控制来自多个分支的信息流携带不同尺度的信息进入下一层的神经元;首先通过融合来自多个分支的结果:然后U经过F
gp
全局平均池化
[0032][0033]F
gp
、i、j、u
c
(i,j)分别表示全局空间信息、通道的高从1到H、通道的宽从1到W、通道统计信息,H*W表示空间维度;
[0034]5、根据权利要求4所述的一种基于改进YOLOv5的实时小人脸检测方法,其特征在于,所述引入SK注意力,通过动态计算每个卷积核得到通道的权重
[0035][0036]其中F
scale
(u
c
,s
c
)指的是标量s
c
和特征图的逐通道乘法。
[0037]进一步的,所述步骤3:设计了小人脸特征增强模块,使得特征图继续扩大,同时将浅层特征图与深层特征图进行融合,具体包括以下步骤:
[0038]设计了小人脸特征增强模块,在第17层后,继续对特征图进行上采样处理,使得特征图继续扩大,同时第20层获取到的特征图与第2层的特征图进行融合(concat),以获得更大的特征图进行小目标的检测;
[0039]C1、将特征图进行上采样处理,使得特征图扩大;采用最近邻插值的方法进行上采样处理;
[0040]C2、将浅层特征图与深层特征图进行融合,浅层网络提取的特征和输入比较近,包含更多的像素点的信息,一些细粒度的信息是图像的一些颜色、纹理、边缘、棱角信息,但是由于经过的卷积更少,其语义性更低,噪声更多;深层网络提取的特征,是图像整体性的一些信息,一些粗粒度的信息,包含是更抽象的信息,即语义信息;在第17层后,继续对特征图进行上采样处理,使得特征图继续扩大,同时第20层获取到的特征图与第2层的特征图进行融合(concat),以获得更大的特征图进行小目标的检测。
[0041]进一步的,所述步骤4:采用YOLOv5模型,并将主干特征提取网络C3替换为ShuffleNetV2网络,具体步骤为:
[0042]YOLOv5模型除了ShuffleNetV2网络,还包括CBL、Resunit、SPP、Focus。
[0043]进一步的,所述步骤5将小人脸检测深度学习模型应用于真实场景的小人脸检测,具体包括:
[0044]1.利用图形化工具

Auto Py To Exe

,将训练好的best.pt文件导入到weights文件夹,生成exe文件。
[0045]2.双击运行exe文件,支持图片检测、视频检测、摄像头检测。
[0046]本专利技术的优点及有益效果如下:
[0047]本专利技术主要针对目前流行的基于深度卷积神经网络的人脸检测任务中,将人脸检测作为一个单独的计算机视觉问题进行解决,对于小人脸检测精度和速度无法满足实时检测的要求,将小人脸检测作为一个一般的目标检测任务,从数据的角度来看,人脸所具有的诸如姿态、尺度、遮挡、光照以及模糊等也会出现在其本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5的实时小人脸检测方法,其特征在于,包括以下步骤:步骤1:将人脸数据集划分为训练集和测试集,对训练集进行包括以下预处理:数据集的清洗:检查数据集中的图片和标签文件是否完整,否则删除多余的图片和标签文件,同时将长宽比太小的锚框删除,并且在删除后,检查下是否存在空的标注文件,如果有,也删除;根据Kmeans聚类算法得到自适应锚框;步骤2:基于YOLOv5的小人脸检测模型,引入SK选择性卷积核注意力,通过动态计算每个卷积核得到通道的权重,动态的将各个卷积核的结果进行融合;步骤3:设计小人脸特征增强模块,小人脸特征增强模块是:在第17层后,继续对特征图进行上采样处理,使得特征图继续扩大,同时第20层获取到的特征图与第2层的特征图进行融合(concat),以获得更大的特征图进行小目标的检测,将特征图进行上采样处理,使得特征图继续扩大,同时将浅层特征图与深层特征图进行融合;步骤4:采用YOLOv5模型,并将主干特征提取网络C3替换为ShuffleNetV2网络;步骤5:将训练好的小人脸检测深度学习模型应用于真实场景的小人脸检测。2.根据权利要求1所述的一种基于改进YOLOv5的实时小人脸检测方法,其特征在于,所述步骤1:将人脸数据集划分为训练集和测试集,对训练集进行预处理,根据聚类算法得到自适应锚框,具体包含以下步骤:A1、对训练集中的图片数据进行数据增强,通过平移、旋转、改变图片的宽高比、调整饱和度在内的操作,增加样本数据;A2、通过聚类算法,对训练集中的真实锚框进行聚类分析,得到精确的锚框作为小人脸检测网络的预定值。3.根据权利要求2所述的一种基于改进YOLOv5的实时小人脸检测方法,其特征在于,所述A2、通过聚类算法,对训练集中的真实锚框进行聚类分析,得到精确的锚框作为小人脸检测网络的预定值,具体包括:yolov5生成anchors中不仅仅使用了k

means聚类,还使用了Genetic Algorithm遗传算法,在k

means聚类的结果上进行mutation变异。1.读取训练集中每张图片的宽高以及所有锚框的宽高2.将每张图片中宽高的最大值等比例缩放到指定大小img_size3.将锚框从相对坐标改成绝对坐标(乘以缩放后的宽高)4.筛选锚框,保留宽高都大于等于两个像素的锚框5.使用k

means聚类得到n个锚框(掉k

means包涉及一个白化操作)6.使用遗传算法随机对锚框的宽高进行变异,如果变异后效果变得更好,就将变异后的结果赋值给锚框,如果变异后效果变差就跳过,默认变异1000次7.将最终变异得到的锚框返回。4.根据权利要求1所述的一种基于改进YOLOv5的实时小人脸检测方法,其特征在于,所述步骤2:基于YOLOv5的小人脸检测模型,引入SK注意力,通过动态计算每个卷积核得到通道的权重,动态的将各个卷积核的结果进行融合,具体包括以下步骤:B1、对于任何给定的特征图X∈R
H

【专利技术属性】
技术研发人员:周丽芳刘波李伟生马将凯卢峻民
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1