【技术实现步骤摘要】
基于深度可分离卷积的人脸活体识别模型压缩和移植方法
本专利技术涉及计算机视觉、深度卷积神经网络以及模型压缩领域,具体涉及基于深度可分离卷积的人脸活体识别模型压缩和移植方法。
技术介绍
随着图像处理技术、计算机视觉算法等的日益成熟,人脸识别技术得到蓬勃的发展,而其中人脸防伪技术也是一个重要的研究课题。活体检测是在一些身份验证场景确定对象真实生理特征的方法,在人脸识别应用中,活体检测能通过眨眼、张嘴、摇头、点头等组合动作,使用人脸关键点定位和人脸追踪等技术,验证用户是否为真实活体本人操作。可有效抵御照片、换脸、面具、遮挡以及屏幕翻拍等常见的攻击手段,从而帮助用户甄别欺诈行为,保障用户的利益。深度神经网络在计算机视觉,语音识别等领域取得了巨大成功.然而,目前的深度神经网络模型需要消耗大量的计算资源和存储空间,限制了在移动终端和车载设备等低存储,低延迟需求环境下的应用。近年来深度神经网络在目标识别,图像分类等领域取得了重大突破,然而训练和测试这些大型深度神经网络存在几点限制:1)训练和测试这些深度神经网络需要进行大量的计算( ...
【技术保护点】
1.基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,包括以下步骤:/nS1、通过数据增强的方式进行训练;/nS2、利用卷积神经网络对训练数据集的图像进行训练,并保存训练后得到的卷积神经网络模型;/nS3、基于深度可分离卷积对卷积神经网络模型进行压缩;/nS4、通过对卷积神经网络模型权重进行半精度Float16量化进一步压缩模型,将压缩后的卷积神经网络模型移植到移动端中。/n
【技术特征摘要】
1.基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,包括以下步骤:
S1、通过数据增强的方式进行训练;
S2、利用卷积神经网络对训练数据集的图像进行训练,并保存训练后得到的卷积神经网络模型;
S3、基于深度可分离卷积对卷积神经网络模型进行压缩;
S4、通过对卷积神经网络模型权重进行半精度Float16量化进一步压缩模型,将压缩后的卷积神经网络模型移植到移动端中。
2.根据权利要求1所述的基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,步骤S1所述的训练数据集通过以下方式获得:
根据CASIA-FASD数据集中的视频,逐帧从图像中剪出人脸,这些图像构成训练数据集的一部分;拍摄不同场景下的真假脸的样本图片作为训练数据集的另一部分,并对训练数据集进行图像亮度、对比度、饱和度随机调整,随机旋转的数据增强处理。
3.根据权利要求2所述的基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,步骤S2所述改进的卷积神经网络结构如下:
所述基于深度可分离卷积改进的VGG11网络,改进的VGG11网络包括11个卷积层和三个全连接层,前面六层卷积层分别为三组深度可分离卷积,每层卷积层后面加ReLU层即卷积层+ReLU层,每两个卷积层+ReLU层后面连接一个最大池化层和一个随机失活层即dropout,最后的三个随机失活层后面分别连接一层全连接层,每个全连接层后面连接有ReLU层,最后的ReLU层连接softmax层;在前两个卷积层的输出中,每个卷积层连接一个批量归一化(BatchNormalization,BN)层,BN层连接一个最大池化层,该最大池化层再与一个随机失活层连接。
4.根据权利要求3所述的基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,改进的卷积神经网络的训练方式如下:
1)对前两层卷积层的输出进行批量归一化(BatchNormalization),批量归一化原理公式如下:
其中x(k)是输入的第k维向量,E[x(k)]为x(k)的均值,Var[x(k)]为x(k)的方差;
2)对每层卷积层输出使用dropout;
3)学习率采用衰减学习率,在训练改进的卷积神经网络时,使用学习率控制参数的更新速度。
5.根据权利要求4所述的基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,采用dropout的VGG11网络结构计算公式如下:
rj(l)~Bernoulli(p)
y(l)=r(l)*y(l)
zi(l+1)=wi(l+1)yl+bi(l+1)
yi(l+1)=f(zi(l+1))
其中,zi(l+1)是改进后的卷积神经网络中某层的输出,yi(l+1)是改进后的卷积神经网络的最终输出,y(l)是经过dropout操作后的某层神经元输出值,Bernoulli函数是为...
【专利技术属性】
技术研发人员:谢巍,周延,陈定权,许练濠,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。