一种课堂环境下的人脸识别检测方法技术

技术编号:37549156 阅读:8 留言:0更新日期:2023-05-12 16:27
本发明专利技术具体公开了一种课堂环境下的人脸识别检测方法,所述方法包括:S1、对YOLOV5算法的网络框架进行改进,具体包括:在原YOLOV5算法的网络框架上增加一个小尺度人脸检测层;然后,基于特征融合方法建立不同通道自适应多尺度卷积骨干网络;最后将数据金字塔融合策略应用于自适应多尺度卷积骨干网络中;S2、基于预设的训练数据集对所述改进后的YOLOV5算法网络进行训练;S3、基于训练好的改进后的YOLOV5算法网络模型对课堂环境下人脸图像进行识别检测。本发明专利技术降低了课堂环境下人脸的漏检率,解决了小尺度人脸难以检测的问题,同时也解决了尺度不一以及模糊人脸检测效果不佳的问题。了尺度不一以及模糊人脸检测效果不佳的问题。了尺度不一以及模糊人脸检测效果不佳的问题。

【技术实现步骤摘要】
一种课堂环境下的人脸识别检测方法


[0001]本专利技术涉及人脸识别
,尤其涉及一种课堂环境下的人脸识别检测方法。

技术介绍

[0002]近些年来,人脸检测已经得到了突飞猛进的发展,最先进的算法在各项大型公开数据集的精确度也已经达到了90%以上。由于真实环境下的数据集的缺少以及数据集质量参差不齐等因素,非约束环境下的人脸检测算法准确率较低。课堂环境作为非约束环境之一,光照条件、人脸姿态、运动以及人脸与相机的相对距离不一等都是课堂环境中人脸检测的难点。随着智慧教育的推广,课堂环境下的人脸检测有助于人脸识别、无感考勤、学生专注度检测等后续工作的研究。越来越多的学者开始研究课堂环境下的人脸检测。
[0003]Phakjira等人将通用实例分割与鲁棒人脸检测算法相结合的综合方法检测人脸并分割出学生这一对象;Karnalim等人提出了一个公开的课堂环境人脸检测数据集,并使用4种预训练模型对数据集进行量化,但是该数据集人脸清晰且分散,并不适用于10人以上课堂环境人脸检测;Hu提出了一个非公开的0

15人的课堂环境人脸检测数据集并通过MTCNN结合HOG算法检测学生人脸;Liu 等人根据教室内学生人数规模大小建立了完整课堂环境的人脸数据集,并通过优化Faster RCNN完成学生人脸检测;Gu通过简化MTCNN,并引入残差生成特征模块实现对真实课堂环境下学生人脸的检测。

技术实现思路

[0004]为解决上述技术问题,本专利技术提供一种课堂环境下的人脸识别检测方法,所述方法包括以下步骤:S1、对YOLOV5算法的网络框架进行改进,获取改进后的YOLOV5算法网络框架,具体包括:首先在原YOLOV5算法的网络框架上增加一个小尺度人脸检测层;然后,基于特征融合方法建立不同通道自适应多尺度卷积骨干网络;最后将数据金字塔融合策略应用于自适应多尺度卷积骨干网络中;S2、基于预设的训练数据集对所述改进后的YOLOV5算法网络进行训练,获得训练好的改进后的YOLOV5算法网络模型;S3、基于训练好的改进后的YOLOV5算法网络模型对课堂环境下人脸图像进行识别检测。
[0005]优选地,所述步骤S1在原YOLOV5算法的网络框架上增加一个小尺度人脸检测层,具体为:基于原YOLOV5算法的PANet网络框架增加一个用于检测4
×
4以上绩效人脸的160
×
160特征输出层。
[0006]优选地,所述步骤S1基于特征融合方法建立一个不同通道自适应多尺度卷积骨干网络,至少包括以下步骤:S11、将原特征图通过不同尺度卷积并进行拼接,生成新的多尺度特征图;S12、利用SE注意力机制模块提取新的多尺度特征图中不同通道的注意力权重,并
通过softmax函数对对应通道方向的注意力向量进行重新标定,得到自适应多尺度融合特征图;S13、将原特征图与自适应多尺度融合特征图进行匹配拼接,进而得到拼接特征图,实现不同通道自适应多尺度卷积骨干网络的建立。
[0007]优选地,所述步骤S11具体为:首先,利用一个1
×
1卷积降低原特征图的参数量,然后将卷积后的原特征图通道分为四组,针对不同通道的原特征图使用多种尺度的卷积核分组卷积,用公式表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)式(1)中,表示输出通道数,表示输入通道数;其中,原特征图对应的四组不同空间特征利用式(1)可以学习到不同尺度的空间信息,并基于Concatenation方式实现跨通道融合,得到新的多尺度特征图,用公式表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)式(2)中,表示新的多尺度特征图,分别表示不同尺度卷积后的特征图。
[0008]优选地,所述步骤S12具体为:首先,利用SE注意力机制模块提取新的多尺度特征图中每个尺度的注意力权重,用公式表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)式(3)中,表示SE注意力机制模块在新的多尺度特征图中提取的不同尺度的注意力权重,表示不同尺度卷积后的特征图,表示尺度卷积;然后,将不同尺度的注意力权重融合,得到通道方向的注意力向量,用公式表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)式(4)中,表示通道方向的注意力向量;最后,利用softmax函数对通道方向的注意力向量进行重新标定,用公式表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀ
(5)式(5)中,表示重新标定后的通道方向的注意力向量。
[0009]优选地,所述步骤S13具体为:首先,将重新标定的通道方向的注意力向量与对应通道的多尺度特征图相乘,得到加权特征图,用公式表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)式(6)中,表示第个尺度对应的加权特征图;然后,将原特征图与加权特征图在维度上进行拼接,得到拼接特征图,进而完成不
同通道自适应多尺度卷积骨干网络的建立,用公式表示为:
ꢀꢀꢀꢀꢀ
(7)式(7)中,表示拼接特征图。
[0010]优选地,所述步骤S13中的拼接特征图还可进一步拼接,具体为:通过1
×
1卷积降低参数,然后将原特征图与拼接特征图在维度上进一步拼接,用公式表示为:
ꢀꢀꢀꢀꢀꢀ
(8)式(8)中,表示进一步拼接后的拼接特征图,表示对输入图像进行卷积。
[0011]优选地,所述步骤S1将数据金字塔融合策略应用于自适应多尺度卷积骨干网络中的具体表现为:通过上采样和下采样将需要融合的特征图修改为统一尺寸,然后设定不同的权重值将需要融合的特征图进行融合。
[0012]优选地,所述步骤S2中,基于预设的训练数据集对所述改进后的YOLOV5算法网络进行训练的损失函数为边框回归损失函数和目标损失函数的联合函数,其用公式表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)式(9)中,表示边框回归损失函数,表示目标损失函数,其中:,式中,表示prediction box,表示ground

truth box,表示包含和的最小矩形框;,式中,表示真实标签,表示模型预测框内是否为人脸,表示样本,表示样本总数。
[0013]与现有技术比较,本专利技术所提供的一种课堂环境下的人脸识别检测方法,所述检测方法通过增加一个小尺度人脸检测层,能够对课堂环境下的小人脸进行有效识别;同时,利用不同通道自适应多尺度卷积骨干网络保证原有特征图特征不损失的基础上得到新的特征,以实现对尺度不一以及模糊人脸的有效检测;而且,将数据金字塔融合策略应用到自适应多尺度卷积骨干网络中,实现了不用尺度检测层之间的自适应融合,进而能够有效降低课堂环境下人脸的漏检率。
附图说明
[0014]图1是本专利技术一种课堂环境下的人脸识别检测方法的流程图,图2是本实施例中测试集中各子集对应部分数据示例图,图3是训练过程中损失函数的变化过程图以及指标值变化曲线图,图4是YOLOV5原骨干网络与本专利技术改进后的自适应多尺度骨干网络特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种课堂环境下的人脸识别检测方法,其特征在于,所述方法包括以下步骤:S1、对YOLOV5算法的网络框架进行改进,获取改进后的YOLOV5算法网络框架,具体包括:首先在原YOLOV5算法的网络框架上增加一个小尺度人脸检测层;然后,基于特征融合方法建立不同通道自适应多尺度卷积骨干网络;最后将数据金字塔融合策略应用于自适应多尺度卷积骨干网络中;S2、基于预设的训练数据集对所述改进后的YOLOV5算法网络进行训练,获得训练好的改进后的YOLOV5算法网络模型;S3、基于训练好的改进后的YOLOV5算法网络模型对课堂环境下人脸图像进行识别检测。2.如权利要求1所述的课堂环境下的人脸识别检测方法,其特征在于,所述步骤S1在原YOLOV5算法的网络框架上增加一个小尺度人脸检测层,具体为:基于原YOLOV5算法的PANet网络框架增加一个用于检测4
×
4以上绩效人脸的160
×
160特征输出层。3.如权利要求2所述的课堂环境下的人脸识别检测方法,其特征在于,所述步骤S1基于特征融合方法建立一个不同通道自适应多尺度卷积骨干网络,至少包括以下步骤:S11、将原特征图通过不同尺度卷积并进行拼接,生成新的多尺度特征图;S12、利用SE注意力机制模块提取新的多尺度特征图中不同通道的注意力权重,并通过softmax函数对对应通道方向的注意力向量进行重新标定,得到自适应多尺度融合特征图;S13、将原特征图与自适应多尺度融合特征图进行匹配拼接,进而得到拼接特征图,实现不同通道自适应多尺度卷积骨干网络的建立。4.如权利要求3所述的课堂环境下的人脸识别检测方法,其特征在于,所述步骤S11具体为:首先,利用一个1
×
1卷积降低原特征图的参数量,然后将卷积后的原特征图通道分为四组,针对不同通道的原特征图使用多种尺度的卷积核分组卷积,用公式表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)式(1)中,表示输出通道数,表示输入通道数;其中,原特征图对应的四组不同空间特征利用式(1)可以学习到不同尺度的空间信息,并基于Concatenation方式实现跨通道融合,得到新的多尺度特征图,用公式表示为:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)式(2)中,表示新的多尺度特征图,分别表示不同尺度卷积后的特征图。5.如权利要求4所述的课堂环境下的人脸识别检测方法,其特征在于,所述步骤S12具体为:首先,利用SE注意力机制模块提取新的多尺度特征图中每个尺度的注意力权重,用公式...

【专利技术属性】
技术研发人员:张锦陶佳宏孙程陶占亚
申请(专利权)人:湖南乐然智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1