基于深度可分离卷积的人脸活体识别模型压缩和移植方法技术

技术编号:28624510 阅读:67 留言:0更新日期:2021-05-28 16:20
本发明专利技术涉及一种基于深度可分离卷积的人脸活体识别模型压缩和移植方法,包括如下步骤:S1、通过数据增强的方式获得一个训练数据集;S2、利用改进的卷积神经网络对图像进行训练,并保存训练后得到的卷积神经网络模型;S3、基于深度可分离卷积对模型进行压缩,削减模型大小,使得模型参数削减为原始模型的20%左右,使得其尺寸更适合于移动端。S4、通过对模型权重进行半精度Float16量化进一步地压缩模型,加快模型推理速度,使得模型大小压缩为S3步骤的50%,移动端识别速度缩短为400ms,完成模型在移动端软件的移植。本发明专利技术基于深度可分离卷积对模型进行压缩且Float16半精度量化。

【技术实现步骤摘要】
基于深度可分离卷积的人脸活体识别模型压缩和移植方法
本专利技术涉及计算机视觉、深度卷积神经网络以及模型压缩领域,具体涉及基于深度可分离卷积的人脸活体识别模型压缩和移植方法。
技术介绍
随着图像处理技术、计算机视觉算法等的日益成熟,人脸识别技术得到蓬勃的发展,而其中人脸防伪技术也是一个重要的研究课题。活体检测是在一些身份验证场景确定对象真实生理特征的方法,在人脸识别应用中,活体检测能通过眨眼、张嘴、摇头、点头等组合动作,使用人脸关键点定位和人脸追踪等技术,验证用户是否为真实活体本人操作。可有效抵御照片、换脸、面具、遮挡以及屏幕翻拍等常见的攻击手段,从而帮助用户甄别欺诈行为,保障用户的利益。深度神经网络在计算机视觉,语音识别等领域取得了巨大成功.然而,目前的深度神经网络模型需要消耗大量的计算资源和存储空间,限制了在移动终端和车载设备等低存储,低延迟需求环境下的应用。近年来深度神经网络在目标识别,图像分类等领域取得了重大突破,然而训练和测试这些大型深度神经网络存在几点限制:1)训练和测试这些深度神经网络需要进行大量的计算(训练和测试将消耗大量本文档来自技高网...

【技术保护点】
1.基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,包括以下步骤:/nS1、通过数据增强的方式进行训练;/nS2、利用卷积神经网络对训练数据集的图像进行训练,并保存训练后得到的卷积神经网络模型;/nS3、基于深度可分离卷积对卷积神经网络模型进行压缩;/nS4、通过对卷积神经网络模型权重进行半精度Float16量化进一步压缩模型,将压缩后的卷积神经网络模型移植到移动端中。/n

【技术特征摘要】
1.基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,包括以下步骤:
S1、通过数据增强的方式进行训练;
S2、利用卷积神经网络对训练数据集的图像进行训练,并保存训练后得到的卷积神经网络模型;
S3、基于深度可分离卷积对卷积神经网络模型进行压缩;
S4、通过对卷积神经网络模型权重进行半精度Float16量化进一步压缩模型,将压缩后的卷积神经网络模型移植到移动端中。


2.根据权利要求1所述的基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,步骤S1所述的训练数据集通过以下方式获得:
根据CASIA-FASD数据集中的视频,逐帧从图像中剪出人脸,这些图像构成训练数据集的一部分;拍摄不同场景下的真假脸的样本图片作为训练数据集的另一部分,并对训练数据集进行图像亮度、对比度、饱和度随机调整,随机旋转的数据增强处理。


3.根据权利要求2所述的基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,步骤S2所述改进的卷积神经网络结构如下:
所述基于深度可分离卷积改进的VGG11网络,改进的VGG11网络包括11个卷积层和三个全连接层,前面六层卷积层分别为三组深度可分离卷积,每层卷积层后面加ReLU层即卷积层+ReLU层,每两个卷积层+ReLU层后面连接一个最大池化层和一个随机失活层即dropout,最后的三个随机失活层后面分别连接一层全连接层,每个全连接层后面连接有ReLU层,最后的ReLU层连接softmax层;在前两个卷积层的输出中,每个卷积层连接一个批量归一化(BatchNormalization,BN)层,BN层连接一个最大池化层,该最大池化层再与一个随机失活层连接。


4.根据权利要求3所述的基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,改进的卷积神经网络的训练方式如下:
1)对前两层卷积层的输出进行批量归一化(BatchNormalization),批量归一化原理公式如下:



其中x(k)是输入的第k维向量,E[x(k)]为x(k)的均值,Var[x(k)]为x(k)的方差;
2)对每层卷积层输出使用dropout;
3)学习率采用衰减学习率,在训练改进的卷积神经网络时,使用学习率控制参数的更新速度。


5.根据权利要求4所述的基于深度可分离卷积的人脸活体识别模型压缩和移植方法,其特征在于,采用dropout的VGG11网络结构计算公式如下:
rj(l)~Bernoulli(p)
y(l)=r(l)*y(l)
zi(l+1)=wi(l+1)yl+bi(l+1)
yi(l+1)=f(zi(l+1))
其中,zi(l+1)是改进后的卷积神经网络中某层的输出,yi(l+1)是改进后的卷积神经网络的最终输出,y(l)是经过dropout操作后的某层神经元输出值,Bernoulli函数是为...

【专利技术属性】
技术研发人员:谢巍周延陈定权许练濠
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1