基于线性注意力机制的人脸活体检测模型的构建方法技术

技术编号:39318665 阅读:10 留言:0更新日期:2023-11-12 16:00
本发明专利技术公开了基于线性注意力机制的人脸活体检测模型的构建方法,包括从数据集中提取包含人脸的人脸图像,进行数据预处理;构建基于卷积神经网络的特征提取人脸图像的基础模型,得到特征图;通过构建通道注意力层和位置注意力层,构成完整的特征提取网络,将特征图通过特征提取网络进行特征融合,得到进阶特征图。本发明专利技术在经典的点乘注意力机制的基础上,对软最大化函数进行线性优化,并基于矩阵乘法结合律,改变矩阵因子乘法顺序,使得原始复杂度为O(N2)降为O(N),使得该线性注意力机制的人脸活体检测模型的构建在保证识别性能的前提下,可以有效的减少计算复杂度。可以有效的减少计算复杂度。可以有效的减少计算复杂度。

【技术实现步骤摘要】
基于线性注意力机制的人脸活体检测模型的构建方法


[0001]本专利技术涉及活体检测
,具体涉及基于线性注意力机制的人脸活体检测模型的构建方法。

技术介绍

[0002]随着人工智能和人脸识别技术的进步,人脸活体检测在人脸识别系统中的重要性日益凸显,然而,现有的人脸活体检测方法存在一些问题,如用户体验不佳、复杂度高、依赖性强等,需要追求一种新的人脸活体检测方法,以解决这些问题;目前,主流的人脸活体检测方法可分为需要利用辅助信息的方法和不需要利用辅助信息的方法;前者需要用户做出特定动作反馈,虽然结果可靠,但用户体验差且效率低;而后者则更符合未来的发展趋势,只利用可见光下的人脸图像进行检测;
[0003]然而,现有的深度学习方法在参数量庞大时,其检测速度慢,精度低,为了解决这些问题,通常都是引入双重注意力机制网络的方案构建模型,从而可以高效的处理复杂多样的场景,并通过自注意机制来捕捉特征图中的空间和通道依赖关系,进一步增强特征表示,但是引入双重注意力机制网络会存在计算复杂度高、计算精度低的问题,亟需改善;
[0004]因此,专利技术基于线性注意力机制的人脸活体检测模型的构建方法来解决上述问题很有必要。

技术实现思路

[0005]本专利技术的目的是提供基于线性注意力机制的人脸活体检测模型的构建方法,在经典的点乘注意力机制的基础上,对软最大化函数进行线性优化,此外基于矩阵乘法结合律,改变矩阵因子乘法顺序,使得原始复杂度为O(N2)降为O(N),使得该线性注意力机制的人脸活体检测模型的构建在保证识别性能的前提下,可以有效的减少计算复杂度。
[0006]为了实现上述目的,本专利技术提供如下技术方案:基于线性注意力机制的人脸活体检测模型的构建方法,包括以下步骤:
[0007]步骤1、从数据集中提取包含人脸的人脸图像,进行数据预处理;
[0008]步骤2、构建基于卷积神经网络的特征提取人脸图像的基础模型,得到特征图;
[0009]步骤3、通过构建通道注意力层和位置注意力层,构成完整的特征提取网络,将特征图通过特征提取网络进行特征融合,得到进阶特征图;
[0010]步骤4、将进阶特征图接入全连接网络进行分类识别,完成对真人脸与假人脸的识别能力,使进阶特征图转化为二维向量,自此,人脸活体检测模型构建完毕;
[0011]步骤5、基于全连接层输出的二维向量结果,利用二元交叉熵损失得到分类结果,并进行反向传播,完成该人脸活体检测模型的网络参数更新;步骤6、使用训练得到的模型参数在未知测试集上进行验证,并用召回率、准确率对该人脸活体检测模型性能进行综合评测。
[0012]前述的基于线性注意力机制的人脸活体检测模型的构建方法,在步骤1中,从数据
集中提取包含人脸的人脸图像,进行数据预处理,具体步骤为:
[0013]1.1、创建一个人脸图像的4维通道,对人脸图像的红、绿、蓝三个通道的像素求取整体平均值,具体公式如下:
[0014][0015]其中,R为Red,表示人脸图像的红;G为Green,表示人脸图像的绿;B为Blue,表示人脸图像的蓝;
[0016]N为训练集图片总数;
[0017]μ
R
为计算所有人脸图像的R通道的平均值;
[0018]μ
G
为计算所有人脸图像的G通道的平均值;
[0019]μ
B
为计算所有人脸图像的B通道的平均值;
[0020]i
为图片序数;
[0021]1.2、将每个像素值减去平均值,具体公式如下:
[0022][0023]其中,σ为加入的比例因子,表示训练集上的标准偏差,具体的,σ=1;
[0024]1.3、对经过光照处理的每张图片进行随机的漂移、翻转、旋转、缩放,增加数据的数量。
[0025]前述的基于线性注意力机制的人脸活体检测模型的构建方法,构建基于卷积神经网络的特征提取人脸图像的基础模型,得到特征图,该基于卷积神经网络的特征具有以下特点:
[0026]卷积神经网络由四个基础卷积块和一个最大池化层组成,每个基础卷积块有一个卷积层和一个批归一化层组成;
[0027]卷积层的卷积核大小为3
×
3,个数为128,步长为1,激活函数为线性整流函数,填充方式为same;
[0028]池化层的卷积核为2
×
2,步长为2。
[0029]前述的基于线性注意力机制的人脸活体检测模型的构建方法,在步骤3中,通过构建通道注意力层和位置注意力层,构成完整的特征提取网络,将特征图通过特征提取网络进行特征融合,得到进阶特征图;
[0030]其中,构建位置注意力层的具体步骤为:
[0031]3.1.1、根据点积注意力机制,记卷积神经网络得到的特征图为A,且
将A分别通过三个卷积层,得到查询向量Q,且键向量K,且值向量V,且
[0032]其中,H为特征高度,
[0033]W为特征宽度,
[0034]C为通道数;
[0035]其中,该点注意力机制的公式如下:
[0036]s(Q*K,V)=(Q*K)
T
V
[0037]其中,Q为查询向量,K为键向量,V为值向量;
[0038]3.1.2、将A、Q、K、V的维度变换为使用点积运算作为注意力打分函数,并使用软最大化函数,按行进行归一化,计算出注意力分布且具体计算公式如下:
[0039]s=softmax(QK
T
)
[0040]3.1.3、将注意力分布s与V进行点积运算得到输出向量且具体计算公式如下:
[0041]H=sV=softmax(QK
T
)V
[0042]3.1.4、将输出序列H乘以一个可学习的比例参数α,并使它与特征图A进行逐元素求和运算,输出后变换维度为且具体计算公式如下:
[0043]M
PA
=αH+A
[0044]其中,α被初始化为0,并逐渐学习分配更多的权重,
[0045]M
PA
为原本的通道注意力机制,
[0046]其中,构建通道注意力层的具体步骤为:
[0047]3.2.1、直接使用A与其转置矩阵A
T
和软最大化函数计算出通道注意力分布图且具体计算公式如下:
[0048]x=softmax(A
T
A)
[0049]3.2.2、将x映射到A上,乘以一个可学习参数β,再加上A得出结果,并将结果进行维度变换为且具体变换公式为:
[0050]E
CA
=β(Ax)+A
[0051]其中,β是一个从0开始学习的参数,
[0052]E
CA
是加权的所有通道的特征与原始特征的总和,
[0053]其中,构建通道注意力层和位置注意力层,构成完整的特征提取网络的具体步骤为:...

【技术保护点】

【技术特征摘要】
1.基于线性注意力机制的人脸活体检测模型的构建方法,其特征在于:包括以下步骤:步骤1、从数据集中提取包含人脸的人脸图像,进行数据预处理;步骤2、构建基于卷积神经网络的特征提取人脸图像的基础模型,得到特征图;步骤3、通过构建通道注意力层和位置注意力层,构成完整的特征提取网络,将特征图通过特征提取网络进行特征融合,得到进阶特征图;步骤4、将进阶特征图接入全连接网络进行分类识别,完成对真人脸与假人脸的识别能力,使进阶特征图转化为二维向量,自此,人脸活体检测模型构建完毕;步骤5、基于全连接层输出的二维向量结果,利用二元交叉熵损失得到分类结果,并进行反向传播,完成该人脸活体检测模型的网络参数更新;步骤6、使用训练得到的模型参数在未知测试集上进行验证,并用召回率、准确率对该人脸活体检测模型性能进行综合评测。2.根据权利要求1所述的基于线性注意力机制的人脸活体检测模型的构建方法,其特征在于:在步骤1中,从数据集中提取包含人脸的人脸图像,进行数据预处理,具体步骤为:1.1、创建一个人脸图像的4维通道,对人脸图像的红、绿、蓝三个通道的像素求取整体平均值,具体公式如下:其中,R为Red,表示人脸图像的红;G为Green,表示人脸图像的绿;B为Blue,表示人脸图像的蓝;N为训练集图片总数;μ
R
为计算所有人脸图像的R通道的平均值;μ
G
为计算所有人脸图像的G通道的平均值;μ
B
为计算所有人脸图像的B通道的平均值;
i
为图片序数;1.2、将每个像素值减去平均值,具体公式如下:其中,σ为加入的比例因子,表示训练集上的标准偏差,具体的,σ=1;1.3、对经过光照处理的每张图片进行随机的漂移、翻转、旋转、缩放,增加数据的数量。3.根据权利要求1所述的基于线性注意力机制的人脸活体检测模型的构建方法,其特征在于:在步骤2中,构建基于卷积神经网络的特征提取人脸图像的基础模型,得到特征图,
该基于卷积神经网络的特征具有以下特点:卷积神经网络由四个基础卷积块和一个最大池化层组成,每个基础卷积块有一个卷积层和一个批归一化层组成;卷积层的卷积核大小为3
×
3,个数为128,步长为1,激活函数为线性整流函数,填充方式为same;池化层的卷积核为2
×
2,步长为2。4.根据权利要求1所述的基于线性注意力机制的人脸活体检测模型的构建方法,其特征在于:在步骤3中,通过构建通道注意力层和位置注意力层,构成完整的特征提取网络,将特征图通过特征提取网络进行特征融合,得到进阶特征图;其中,构建位置注意力层的具体步骤为:3.1.1、根据点积注意力机制,记卷积神经网络得到的特征图为A,且将A分别通过三个卷积层,得到查询向量Q,且键向量K,且值向量V,且其中,
H
为特征高度,W为特征宽度,C为通道数;其中,该点注意力机制的公式如下:s(Q*K,V)=(Q*K)
T
V其中,Q为查询向量,K为键向量,V为值向量;3.1.2、将A、Q、K、V的维度变换为使用点积运算作为注意力打分函数,并使用软最大化函数,按行进行归一化,计算出注意力分布且具体计算公式如下:s=softmax(QK
T
)3.1.3、将注意力分布s与V进行点积运算得到输...

【专利技术属性】
技术研发人员:田坤朱益良王健伟张忠宇王宇达张威刘叶轩
申请(专利权)人:南京工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1