一种基于双重数据增强的人脸识别方法技术

技术编号：19635595 阅读：55 留言：0更新日期：2018-12-01 16:14

本发明专利技术公开了一种基于双重数据增强的人脸识别方法，经过双重数据增强得到的人脸数据集，提升了人脸识别的准确率。包括：S1、选择数据集；S2、数据集预处理；S3、第一重数据增强：搭建基于信息最大化的生成对抗网络模型，并完成训练；S4、第二重数据增强：对S3中生成的人脸样本进行平移、旋转、翻转以及缩放处理；S5、人脸分类选择卷积神经网络模型来对S4中生成的人脸样本进行训练与识别。

A Face Recognition Method Based on Double Data Enhancement

The invention discloses a face recognition method based on double data enhancement. The face data set obtained by double data enhancement improves the accuracy of face recognition. Including: S1, data set selection; S2, data set preprocessing; S3, the first data enhancement: build a generation antagonism network model based on information maximization and complete training; S4, the second data enhancement: face samples generated in S3 are translated, rotated, flipped and scaled; S5, face classification and selection volume The product neural network model is used to train and recognize face samples generated in S4.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双重数据增强的人脸识别方法
本专利技术属于机器学习领域，特别涉及一种基于双重数据增强的人脸识别方法。
技术介绍
有监督学习是机器学习领域一种常用的方法，它是指分别将大规模数据集中的数据以及对应的标签作为某种数学模型的输入，然后对该模型进行训练使其学习到已知数据的特征，从而对未知的数据进行处理的过程。根据有监督学习的定义可知，数据集是决定最终模型性能优劣的关键环节之一。随着深度学习技术的不断发展以及在不同领域中开源数据集的出现，有监督学习方法得到了更加广泛的应用。但是，目前开源的数据集还是存在一些不足。以人脸数据集为例，一方面存在总体样本有限的问题，另一方面对于单个人脸样本而言，它包含的特征属性十分有限，同时数据集的收集、整理、标记是一个非常耗费时间与精力的过程，所以想要在一个大规模数据集中将所有单个人脸样本的一系列连续变化的特征属性包含在内显得十分困难。因此，目前人脸数据集存在的这些问题一定程度上限制了基于有监督学习方法的人脸识别在更多应用场景下的推广。
技术实现思路
本专利技术针对现有人脸数据集存在的一些不足之处，提供一种基于双重数据增强的人脸识别方法，经过双重数据增强得到的人脸数据集，提升了人脸识别的准确率。本专利技术的目的是这样实现的：一种基于双重数据增强的人脸识别方法，包括以下步骤：S1、选择数据集；S2、数据集预处理；S3、第一重数据增强：搭建基于信息最大化的生成对抗网络模型，基于信息最大化的生成对抗网络模型包括生成器G与判别器D，生成器G通过控制潜在变量c的类型以及维度，从而利用随机噪声向量z生成与真实样本X概率密度分布接近的生成样本G(z...

【技术保护点】
1.一种基于双重数据增强的人脸识别方法，其特征在于：包括以下步骤：S1、选择数据集；S2、数据集预处理；S3、第一重数据增强：搭建基于信息最大化的生成对抗网络模型，基于信息最大化的生成对抗网络模型包括生成器G与判别器D，生成器G通过控制潜在变量c的类型以及维度，从而利用随机噪声向量z生成与真实样本X概率密度分布接近的生成样本G(z,c)，将生成样本G(z,c)与真实样本X分别作为判别器D的输入，判别器D负责对输入的生成样本G(z,c)与真实样本X进行“真”与“假”的判断，最终在基于信息最大化的生成对抗网络模型中，生成器G与判别器D进行不断的交替训练，生成器G不断提升自己的生成能力，判别器D则不断优化自己的分类能力，当判别器D无法判断某一个人脸样本是来自于生成样本还是真实样本X时，该模型训练完成；S4、第二重数据增强：对S3中生成的人脸样本进行平移、旋转、翻转以及缩放处理；S5、人脸分类选择卷积神经网络模型来对S4中生成的人脸样本进行训练与识别。

【技术特征摘要】
1.一种基于双重数据增强的人脸识别方法，其特征在于：包括以下步骤：S1、选择数据集；S2、数据集预处理；S3、第一重数据增强：搭建基于信息最大化的生成对抗网络模型，基于信息最大化的生成对抗网络模型包括生成器G与判别器D，生成器G通过控制潜在变量c的类型以及维度，从而利用随机噪声向量z生成与真实样本X概率密度分布接近的生成样本G(z,c)，将生成样本G(z,c)与真实样本X分别作为判别器D的输入，判别器D负责对输入的生成样本G(z,c)与真实样本X进行“真”与“假”的判断，最终在基于信息最大化的生成对抗网络模型中，生成器G与判别器D进行不断的交替训练，生成器G不断提升自己的生成能力，判别器D则不断优化自己的分类能力，当判别器D无法判断某一个人脸样本是来自于生成样本还是真实样本X时，该模型训练完成；S4、第二重数据增强：对S3中生成的人脸样本进行平移、旋转、翻转以及缩放处理；S5、人脸分类选择卷积神经网络模型来对S4中生成的人脸样本进行训练与识别。2.根据权利要求1所述的一种基于双重数据增强的人脸识别方法，其特征在于：S1中，选择香港中文大学的开源人脸数据集CelebA，作为数据集。3.根据权利要求1所述的一种基于双重数据增强的人脸识别方法，其特征在于：S2中预处理方法如下：对数据集中的图像进行裁剪，并进行归一化处理，将图像的像素值统一到[-1,1]之间。4.根据权利要求1所述的一种基于双重数据增强的人脸识别方法，其特征在于，S3中，搭建基于信息最大化的生成对抗网络模型的方法包括以下步骤：S31、搭建生成器模型G将输入生成器G的随机噪声向量分为不可压缩变量z、潜在变量c，生成器G利用随机噪声向量生成与数据集中人脸的真实样本概率密度分布接近的生成样本G(z,c)；引入了信息论，用I(c,G(c,z))表示潜在变量c与生成器G的输出G(z,c)之间的互信息，两者之间的互信息如下所示：I(c,G(c,z))＝H(c)-H(c|G(z,c))＝H(G(z,c))-H(G(z,c)|c)(1)由上式可得：当潜在变量c一定时，可以减少输出样本G(z,c)的不确定性，如果潜在变量c与输出样本G(z,c)不相关，那么I(c,G(c,z))＝0；为了通过控制潜在变量c获得预期的输出，将互信息项I(c,G(c,z))最大化，原始生成对抗网络的目标函数为：引入互信息项I(c,G(c,z))之后，基于信息最大化的生成对抗网络的目标函数为：同时在生成器G中，使用反卷积层进行上采样，并使用relu激活函数，从而使得噪声逐渐变为高分辨率的图像；S32、搭建判别器模型D判别器D由一个四层的卷积神经网络构成，它的目标尽可能将真实样本X判断为1，生成样本判断为0，于是，设定生成样本G(z,c)为0，真实样本X为1，然后进入判别器D中进行训练，最终得到一个性能优异的分类器；S33、选择优化器选择Adam作为优化器。5.根据权利要求4所述的一种基于双重数据增强的人脸识别方法，其特征在于，S31中，定义不可压缩变量z的维度为128维，潜在变量c的维度为58维，潜在变量c由5个10维的离散变量以及8个连续变量构成，其中，5个10维的离散变量用于控制特征的...

【专利技术属性】
技术研发人员：陈国荣，罗建伟，刘春亮，唐婧，杜晓霞，任虹，刘灿，刘垚，何宏黎，利节，
申请(专利权)人：重庆科技学院，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人