基于GAN扩充多人种特征协同选择的人脸年龄估计方法技术

技术编号:20273506 阅读:34 留言:0更新日期:2019-02-02 04:00
本发明专利技术公开了一种基于GAN扩充多人种特征协同选择的人脸年龄估计方法,先通过生成式对抗网络进行多风格人脸样本的模拟生成,来快速地大规模地扩充不同人种的人脸库,从而提高对黄色、棕色等人种年龄信息识别的精度。然后利用卷积神经网络对原有数据集进行预训练,接着基于扩充得到的人脸年龄数据库进行进一步的精训练。最后将四个人种的Sub‑CNN进行基于组稀疏算法的联合特征选择融合,以此来解决基于人脸图像的年龄估计问题。本发明专利技术得到了更具泛化能力的人脸年龄估计模型,同时也能大大提高很多年龄人脸识别系统的性能,弥补了以往研究的不足之处。

【技术实现步骤摘要】
基于GAN扩充多人种特征协同选择的人脸年龄估计方法
本专利技术涉及一种人脸年龄估计方法,特别是一种基于GAN扩充多人种特征协同选择的人脸年龄估计方法。
技术介绍
随着人机交互的相关理论与应用研究的快速发展,年龄信息作为人类的一种重要生物特征,在此领域中有着众多应用需求,并且对人脸识别系统的性能有着重要影响。但是绝大部分的研究是基于现有的数据集,由于在很多国外的现有大型数据集上黄色、棕色等人种样本过少,大大限制了对黄色、棕色等人种图片的年龄辨识。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于GAN扩充多人种特征协同选择的人脸年龄估计方法,得到更具泛化能力的人脸年龄估计模型。为解决上述技术问题,本专利技术所采用的技术方案是:一种基于GAN扩充多人种特征协同选择的人脸年龄估计方法,其特征在于包含以下步骤:步骤一:通过网络爬虫从Internet网上下载所缺人脸图像集;步骤二:基于步骤一的人脸图像集进行GAN人脸多风格样本输出模型的训练,扩充完善现有人脸年龄数据库;步骤三:在完成基于GAN对人脸年龄数据库模拟生成多风格不同人种人脸年龄图片后,针对每一组人种数据集设计一个CNN模型,总共设计四个串联形式的Sub-CNN,并借助LFW、CACD大型人脸库对Sub-CNN模型进行预训练,然后对其基于扩充得到的人脸年龄数据库进行进一步的精训练;步骤四:基于组稀疏Group-lasso的联合特征选择,应用于神经网络训练权值向量的过程中;步骤五:多人种年龄识别模型建立完成,通过模型进行人脸年龄估计。进一步地,所述步骤二生成式对抗网络为生成式对抗网络由生成模型GenerativeModel和判别模型DiscriminativeModel两个模块构成,生成模型G的目标是使其生成的伪数据G(z)在判别模型D上的表现和真实数据x在D上的表现一致,G和D互相博弈学习并迭代优化的过程使得它们的性能不断提升,随着D的判别能力提升,并且无法判别其数据来源时,则认为G已学到真实的数据分布,根据生成式对抗网络的特性,对通过网络爬虫从网上下载的所缺人脸图像集,进行快速扩充类似的且多风格的样本。进一步地,所述生成模型的作用是尽可能地学习真实的数据分布,输入随机变量z,则G尽可能地生成服从真实数据分布的样本G(z);判别模型的作用是判别其输入数据是来自生成模型G还是来自真实的数据x,如果输入来自G(z),则标注为0并判别为伪,否则标注为1并判别为真。进一步地,所述步骤三具体为世界人种可分为棕色、黄色、黑色、白色,不同人种间的人面部特征由于气候条件、地理位置、传统风俗、遗传因子等因素的影响存在显著的差异性,而在相同人种间这种差异性在某种程度上相对较小,在完成基于GAN对人脸年龄数据库模拟生成多风格不同人种人脸年龄图片后,针对每一组人种数据集,设计一个CNN模型,即总共设计四个串联形式的Sub-CNN,并借助LFW、CACD等大型人脸库对Sub-CNN模型进行预训练,然后对其基于扩充得到的人脸年龄数据库进行进一步的精训练。进一步地,所述借助LFW、CACD等大型人脸库对Sub-CNN模型进行预训练具体过程为针对每一个Sub-CNN,首先借助LFW、CACD、Morph大型人脸库对其模型进行预训练,让Sub-CNN学习到基础人脸特征,构建起初始识别模型,然后在此基础之上,对步骤二中基于GAN扩充得到的人脸年龄数据库进一步精训练,使得Sub-CNN在初始模型的基础上学习到扩充人脸特征,从而构建起最终识别模型。进一步地,所述步骤四具体为在基于McCulloch-Pitts神经元模型的传统卷积神经网络中,各个神经元之间依靠权值向量进行信息传递,训练神经网络的实质即是在训练神经网络层的权值向量;GroupLasso的约束方程如下所示在将该约束方程具体运用到本模型的权值向量训练中后,将该约束方程进行简化,简化之后的公式为其中,d表示神经网络的权值向量的维度,wi表示w矩阵的第i行;公式将步骤三中所划分的四个人种的神经网络的权值向量相连接,完成了将该四个神经网络进行融合;此时,四人种神经网络即是一个相互连接的完整的神经网络,之后根据group-lasso的算法,我们需要将计算结果嵌入到四人种神经网络的全连接层中的损失函数当中,重新定义全连接层中的损失函数,新的损失函数公式如下:newlossfunction=oldlossfunction+λ||W||2,1新的损失函数相比之前的损失函数多了一个偏置项,该偏置项的作用即是实现GroupLasso算法的特征联合选择功能;其中,偏置项的参数λ由实验效果人为调整或者由先验信息决定。本专利技术与现有技术相比,具有以下优点和效果:1、在很多国外的现有大型数据集上由于黄色、棕色等人种样本过少,这就大大限制了对黄色、棕色等人种图片的年龄辨识,通过生成式对抗网络(GAN)能很好的解决这一问题;2、传统卷积神经网络由一整条庞大的神经网络构成,本专利技术通过四人种划分规则,将该神经网络进行模块划分,能够增强神经网络的特定模块处理功能,从而提升人脸年龄估计针对特定种群的识别准确率;3、通过对Sub-CNN基于LFW、CACD、Morph等大型人脸数据集进行预训练,使得神经网络初步学习到基础人脸面部特征,再由GAN扩充人脸数据集进一步精训练,从而继续学习到更加丰富的人脸特征,通过迁移学习的方式,在一定程度上提高了目标模型训练的便捷性与准确性;4、通过将组稀疏算法应用到我们的卷积神经网络模型中,可以有效地提升神经网络的特征选择能力,进而提升模型在人脸年龄估计中的准确度。附图说明图1是本专利技术的基于GAN扩充多人种特征协同选择的人脸年龄估计方法的流程图。图2是本专利技术的四人种神经网络架构图。具体实施方式下面结合附图并通过实施例对本专利技术作进一步的详细说明,以下实施例是对本专利技术的解释而本专利技术并不局限于以下实施例。生成对抗网络(GAN)由生成模型G和判别模型D组成,通过对抗学习的方式训练数集并生成新的数据样本。2014年Goodfellow发表《GenerativeAdversarialNetworks》一文,使生成式对抗网络在学术界首次亮相,其主要思想来自于博弈论(即二人的利益之和为零,一方的所得正式一方的所失)。此后,GAN被应用于解决各种实际问题,诸如语言、语音处理,棋牌比赛程序等问题的研究。生成模型G捕捉样本数据的分布,用服从某一分布(均匀分布,高斯分布等)的噪声z生成一个类似真实训练数据的样本,追求效果是越像真实样本越好;判别模型D是一个二分类器,估计一个样本来自于训练数据(而非生成数据)的概率,如果样本来自于真实的训练数据,D输出大概率,否则,D输出小概率。卷积神经网络是近年发展起来,并引起广泛重视的一种高效识别方法。20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络(ConvolutionalNeuralNetworks-简称CNN)。现在,CNN已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。卷积神经网络(CNN)含有的层级本文档来自技高网...

【技术保护点】
1.一种基于GAN扩充多人种特征协同选择的人脸年龄估计方法,其特征在于包含以下步骤:步骤一:通过网络爬虫从Internet网上下载所缺人脸图像集;步骤二:基于步骤一的人脸图像集进行GAN人脸多风格样本输出模型的训练,扩充完善现有人脸年龄数据库;步骤三:在完成基于GAN对人脸年龄数据库模拟生成多风格不同人种人脸年龄图片后,针对每一组人种数据集设计一个CNN模型,总共设计四个串联形式的Sub‑CNN,并借助LFW、CACD大型人脸库对Sub‑CNN模型进行预训练,然后对其基于扩充得到的人脸年龄数据库进行进一步的精训练;步骤四:基于组稀疏Group‑lasso的联合特征选择,应用于神经网络训练权值向量的过程中;步骤五:多人种年龄识别模型建立完成,通过模型进行人脸年龄估计。

【技术特征摘要】
1.一种基于GAN扩充多人种特征协同选择的人脸年龄估计方法,其特征在于包含以下步骤:步骤一:通过网络爬虫从Internet网上下载所缺人脸图像集;步骤二:基于步骤一的人脸图像集进行GAN人脸多风格样本输出模型的训练,扩充完善现有人脸年龄数据库;步骤三:在完成基于GAN对人脸年龄数据库模拟生成多风格不同人种人脸年龄图片后,针对每一组人种数据集设计一个CNN模型,总共设计四个串联形式的Sub-CNN,并借助LFW、CACD大型人脸库对Sub-CNN模型进行预训练,然后对其基于扩充得到的人脸年龄数据库进行进一步的精训练;步骤四:基于组稀疏Group-lasso的联合特征选择,应用于神经网络训练权值向量的过程中;步骤五:多人种年龄识别模型建立完成,通过模型进行人脸年龄估计。2.按照权利要求1所述的基于GAN扩充多人种特征协同选择的人脸年龄估计方法,其特征在于:所述步骤二生成式对抗网络为生成式对抗网络由生成模型GenerativeModel和判别模型DiscriminativeModel两个模块构成,生成模型G的目标是使其生成的伪数据G(z)在判别模型D上的表现和真实数据x在D上的表现一致,G和D互相博弈学习并迭代优化的过程使得它们的性能不断提升,随着D的判别能力提升,并且无法判别其数据来源时,则认为G已学到真实的数据分布,根据生成式对抗网络的特性,对通过网络爬虫从网上下载的所缺人脸图像集,进行快速扩充类似的且多风格的样本。3.按照权利要求2所述的基于GAN扩充多人种特征协同选择的人脸年龄估计方法,其特征在于:所述生成模型的作用是尽可能地学习真实的数据分布,输入随机变量z,则G尽可能地生成服从真实数据分布的样本G(z);判别模型的作用是判别其输入数据是来自生成模型G还是来自真实的数据x,如果输入来自G(z),则标注为0并判别为伪,否则标注为1并判别为真。4.按照权利要求1所述的基于GAN扩充多人种特征协同选择的人脸年龄估计方法,其特征在于:所述步骤三具体为世界人种可分为棕色、黄色、黑色、白色,不同人种间的人面部特征由于气候条件、地理位置、传统风俗、遗传因子等因素的影响存在显著的...

【专利技术属性】
技术研发人员:田青沈传奇毛军翔孙元康秦璇黄媛沅
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1