一种基于双重数据增强的人脸识别方法技术

技术编号:19635595 阅读:55 留言:0更新日期:2018-12-01 16:14
本发明专利技术公开了一种基于双重数据增强的人脸识别方法,经过双重数据增强得到的人脸数据集,提升了人脸识别的准确率。包括:S1、选择数据集;S2、数据集预处理;S3、第一重数据增强:搭建基于信息最大化的生成对抗网络模型,并完成训练;S4、第二重数据增强:对S3中生成的人脸样本进行平移、旋转、翻转以及缩放处理;S5、人脸分类选择卷积神经网络模型来对S4中生成的人脸样本进行训练与识别。

A Face Recognition Method Based on Double Data Enhancement

The invention discloses a face recognition method based on double data enhancement. The face data set obtained by double data enhancement improves the accuracy of face recognition. Including: S1, data set selection; S2, data set preprocessing; S3, the first data enhancement: build a generation antagonism network model based on information maximization and complete training; S4, the second data enhancement: face samples generated in S3 are translated, rotated, flipped and scaled; S5, face classification and selection volume The product neural network model is used to train and recognize face samples generated in S4.

【技术实现步骤摘要】
一种基于双重数据增强的人脸识别方法
本专利技术属于机器学习领域,特别涉及一种基于双重数据增强的人脸识别方法。
技术介绍
有监督学习是机器学习领域一种常用的方法,它是指分别将大规模数据集中的数据以及对应的标签作为某种数学模型的输入,然后对该模型进行训练使其学习到已知数据的特征,从而对未知的数据进行处理的过程。根据有监督学习的定义可知,数据集是决定最终模型性能优劣的关键环节之一。随着深度学习技术的不断发展以及在不同领域中开源数据集的出现,有监督学习方法得到了更加广泛的应用。但是,目前开源的数据集还是存在一些不足。以人脸数据集为例,一方面存在总体样本有限的问题,另一方面对于单个人脸样本而言,它包含的特征属性十分有限,同时数据集的收集、整理、标记是一个非常耗费时间与精力的过程,所以想要在一个大规模数据集中将所有单个人脸样本的一系列连续变化的特征属性包含在内显得十分困难。因此,目前人脸数据集存在的这些问题一定程度上限制了基于有监督学习方法的人脸识别在更多应用场景下的推广。
技术实现思路
本专利技术针对现有人脸数据集存在的一些不足之处,提供一种基于双重数据增强的人脸识别方法,经过双重数据增强得到的人脸数据集,提升了人脸识别的准确率。本专利技术的目的是这样实现的:一种基于双重数据增强的人脸识别方法,包括以下步骤:S1、选择数据集;S2、数据集预处理;S3、第一重数据增强:搭建基于信息最大化的生成对抗网络模型,基于信息最大化的生成对抗网络模型包括生成器G与判别器D,生成器G通过控制潜在变量c的类型以及维度,从而利用随机噪声向量z生成与真实样本X概率密度分布接近的生成样本G(z,c),将生成样本G(z,c)与真实样本X分别作为判别器D的输入,判别器D负责对输入的生成样本G(z,c)与真实样本X进行“真”与“假”的判断,最终在基于信息最大化的生成对抗网络模型中,生成器G与判别器D进行不断的交替训练,生成器G不断提升自己的生成能力,判别器D则不断优化自己的分类能力,当判别器D无法判断某一个人脸样本是来自于生成样本还是真实样本X时,该模型训练完成;S4、第二重数据增强:对S3中生成的人脸样本进行平移、旋转、翻转以及缩放处理;S5、人脸分类选择卷积神经网络模型来对S4中生成的人脸样本进行训练与识别。优选地,S1中,选择香港中文大学的开源人脸数据集CelebA,作为数据集。优选地,S2中预处理方法如下:对数据集中的图像进行裁剪,并进行归一化处理,将图像的像素值统一到[-1,1]之间。优选地,S3中,搭建基于信息最大化的生成对抗网络模型的方法包括以下步骤:S31、搭建生成器模型G将输入生成器G的随机噪声向量分为不可压缩变量z、潜在变量c,生成器G利用随机噪声向量生成与数据集中人脸的真实样本概率密度分布接近的生成样本G(z,c);引入了信息论,用I(c,G(c,z))表示潜在变量c与生成器G的输出G(z,c)之间的互信息,两者之间的互信息如下所示:I(c,G(c,z))=H(c)-H(c|G(z,c))=H(G(z,c))-H(G(z,c)|c)(1)由上式可得:当潜在变量c一定时,可以减少输出样本G(z,c)的不确定性,如果潜在变量c与输出样本G(z,c)不相关,那么I(c,G(c,z))=0;为了通过控制潜在变量c获得预期的输出,将互信息项I(c,G(c,z))最大化,原始生成对抗网络的目标函数为:引入互信息项I(c,G(c,z))之后,基于信息最大化的生成对抗网络的目标函数为:同时在生成器G中,使用反卷积层进行上采样,并使用relu激活函数,从而使得噪声逐渐变为高分辨率的图像;S32、搭建判别器模型D判别器D由一个四层的卷积神经网络构成,它的目标尽可能将真实样本X判断为1,生成样本判断为0,于是,设定生成样本G(z,c)为0,真实样本X为1,然后进入判别器D中进行训练,最终得到一个性能优异的分类器;S33、选择优化器选择Adam作为优化器。优选地,S31中,定义不可压缩变量z的维度为128维,潜在变量c的维度为58维,潜在变量c由5个10维的离散变量以及8个连续变量构成,其中,5个10维的离散变量用于控制特征的种类,8个连续变量用于控制特征的连续变化。优选地,S33中,Adam的内部参数设定为:学习速率lr=0.0005,β=0.5。优选地,S4中,平移方法为:图像沿X轴或Y轴方向或同时沿X轴、Y轴进行的整体移动,设某点向X轴方向移动tx,Y轴方向移动ty,(x,y)为变换前坐标,(X,Y)为变换后坐标,则平移的公式为:旋转方法为:图像以某一点为圆心,以该点与原点连线为半径,逆时针旋转θ度,设该点(x,y),新的位置(X,Y),则旋转的公式为:翻转方法为:图像将X轴或Y轴作为对轴,所得到镜像,设某点坐标(x,y)沿X轴翻转,转换后的坐标(X1,Y1);沿Y轴翻转,转换后的坐标(X2,Y2),翻转表达式为:缩放方法为:图像的缩放是指图像沿X轴方向与Y轴方向按照一定的比例进行放大或缩小,设图像中某点的坐标为(x,y),在X轴方向缩放sx倍,Y轴方向缩放sy倍,变换后的坐标为(X,Y),则缩放的公式为:优选地,S5中,卷积神经网络模型包括:输入层输入层中,把S4中生成的具有连续特征变化的人脸样本图像作为卷积神经网络的输入,其中80%用于训练,20%用于测试;卷积-池化层调整卷积层的深度与宽度,使卷积层提取人脸图像特征效果最佳,不同的卷积核用于提取不同的特征;浅层卷积层用于提取低级的语义特征;深层卷积层用于提取高级的语义特征,根据图像的复杂程度选择合适的卷积层数,卷积层中输出的新的像素点由以下公式计算得出:其中,f(·)代表激活函数,代表上一层特征图像的某个像素值,代表卷积核,*代表卷积运算;考虑到本层输出可以与上一层多个特征图像关联,Mj表示参与运算的上一层的特征图像的子集;代表偏置项,上标l表示第l层;池化层用于对提取的特征进行降维处理,在卷积运算后得到的特征矩阵的基础上,加入最大池化处理,池化操作中每个神经元对应卷积中每一个N×1位置,其公式为:其中,u(n,1)是卷积操作的一个窗函数,aj对应图像区域的最大值;SoftMax层SoftMax层用于将池化层的输出值映射为相应的概率值,最终选择概率值最大所在的类别作为模型分类的结果,假设输入特征记为x(i),样本标签记为y(i),构成训练集S={(x(1),y(1)),…,(x(m),y(m))},对于给定的输入x,利用假设模型对每个类别j估算其概率值p(y=j|x),其中假设函数为:其中,θ1,θ2,…,θk为可学习的模型参数,为归一化项,使得所有概率之和为1,从而得到代价函数:其中,1{·}为一个指示性函数,当括号内的值为真时,函数的结果为1,否则为0,所述假设函数是对逻辑回归的推广,因此代价函数可以改为:对于SoftMax代价函数J(θ)求其偏导数,得到梯度公式:为一个向量,它的第l个元素是J(θ)对θj的第l个分量的偏导数,得到以上求解偏导数公式后,使用随机梯度下降算法对代价函数J(θ)进行最小化,在每次迭代过程中都需要对参数进行更新:最后实现SoftMax回归分类模型。由于采用了上述技术方案,本专利技术具有如下有益效果:本专利技术中搭建了基于信息最大化的生成对抗网络,英文简称:In本文档来自技高网...

【技术保护点】
1.一种基于双重数据增强的人脸识别方法,其特征在于:包括以下步骤:S1、选择数据集;S2、数据集预处理;S3、第一重数据增强:搭建基于信息最大化的生成对抗网络模型,基于信息最大化的生成对抗网络模型包括生成器G与判别器D,生成器G通过控制潜在变量c的类型以及维度,从而利用随机噪声向量z生成与真实样本X概率密度分布接近的生成样本G(z,c),将生成样本G(z,c)与真实样本X分别作为判别器D的输入,判别器D负责对输入的生成样本G(z,c)与真实样本X进行“真”与“假”的判断,最终在基于信息最大化的生成对抗网络模型中,生成器G与判别器D进行不断的交替训练,生成器G不断提升自己的生成能力,判别器D则不断优化自己的分类能力,当判别器D无法判断某一个人脸样本是来自于生成样本还是真实样本X时,该模型训练完成;S4、第二重数据增强:对S3中生成的人脸样本进行平移、旋转、翻转以及缩放处理;S5、人脸分类选择卷积神经网络模型来对S4中生成的人脸样本进行训练与识别。

【技术特征摘要】
1.一种基于双重数据增强的人脸识别方法,其特征在于:包括以下步骤:S1、选择数据集;S2、数据集预处理;S3、第一重数据增强:搭建基于信息最大化的生成对抗网络模型,基于信息最大化的生成对抗网络模型包括生成器G与判别器D,生成器G通过控制潜在变量c的类型以及维度,从而利用随机噪声向量z生成与真实样本X概率密度分布接近的生成样本G(z,c),将生成样本G(z,c)与真实样本X分别作为判别器D的输入,判别器D负责对输入的生成样本G(z,c)与真实样本X进行“真”与“假”的判断,最终在基于信息最大化的生成对抗网络模型中,生成器G与判别器D进行不断的交替训练,生成器G不断提升自己的生成能力,判别器D则不断优化自己的分类能力,当判别器D无法判断某一个人脸样本是来自于生成样本还是真实样本X时,该模型训练完成;S4、第二重数据增强:对S3中生成的人脸样本进行平移、旋转、翻转以及缩放处理;S5、人脸分类选择卷积神经网络模型来对S4中生成的人脸样本进行训练与识别。2.根据权利要求1所述的一种基于双重数据增强的人脸识别方法,其特征在于:S1中,选择香港中文大学的开源人脸数据集CelebA,作为数据集。3.根据权利要求1所述的一种基于双重数据增强的人脸识别方法,其特征在于:S2中预处理方法如下:对数据集中的图像进行裁剪,并进行归一化处理,将图像的像素值统一到[-1,1]之间。4.根据权利要求1所述的一种基于双重数据增强的人脸识别方法,其特征在于,S3中,搭建基于信息最大化的生成对抗网络模型的方法包括以下步骤:S31、搭建生成器模型G将输入生成器G的随机噪声向量分为不可压缩变量z、潜在变量c,生成器G利用随机噪声向量生成与数据集中人脸的真实样本概率密度分布接近的生成样本G(z,c);引入了信息论,用I(c,G(c,z))表示潜在变量c与生成器G的输出G(z,c)之间的互信息,两者之间的互信息如下所示:I(c,G(c,z))=H(c)-H(c|G(z,c))=H(G(z,c))-H(G(z,c)|c)(1)由上式可得:当潜在变量c一定时,可以减少输出样本G(z,c)的不确定性,如果潜在变量c与输出样本G(z,c)不相关,那么I(c,G(c,z))=0;为了通过控制潜在变量c获得预期的输出,将互信息项I(c,G(c,z))最大化,原始生成对抗网络的目标函数为:引入互信息项I(c,G(c,z))之后,基于信息最大化的生成对抗网络的目标函数为:同时在生成器G中,使用反卷积层进行上采样,并使用relu激活函数,从而使得噪声逐渐变为高分辨率的图像;S32、搭建判别器模型D判别器D由一个四层的卷积神经网络构成,它的目标尽可能将真实样本X判断为1,生成样本判断为0,于是,设定生成样本G(z,c)为0,真实样本X为1,然后进入判别器D中进行训练,最终得到一个性能优异的分类器;S33、选择优化器选择Adam作为优化器。5.根据权利要求4所述的一种基于双重数据增强的人脸识别方法,其特征在于,S31中,定义不可压缩变量z的维度为128维,潜在变量c的维度为58维,潜在变量c由5个10维的离散变量以及8个连续变量构成,其中,5个10维的离散变量用于控制特征的...

【专利技术属性】
技术研发人员:陈国荣罗建伟刘春亮唐婧杜晓霞任虹刘灿刘垚何宏黎利节
申请(专利权)人:重庆科技学院
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1