一种基于梯度对抗攻击和生成对抗模型的人脸图片年龄转换方法技术

技术编号：30552931 阅读：20 留言：0更新日期：2021-10-30 13:33

本发明专利技术公开了一种基于梯度对抗攻击和生成对抗模型的人脸图片年龄转换方法，该方法主要内容是：首先对人脸图片进行对齐，将人脸图片的人脸部分截取下来，并通过图片旋转调整角度得到原图，再给定一个期望的目标人脸年龄；初始化一个隐空间向量，将隐空间向量输入到解码器中，得到生成图片；算法使用年龄估计器，判别器，人脸识别器分别得出生成图片的年龄，真实度和与原图人脸身份相似度的损失；以损失减小作为目标，梯度更新初始化的隐空间向量，然后重复前两步直到达到算法约定的步长。使用该方法可以实现人脸图片的自动转换，帮助刑侦和跨年龄人脸识别，也可以用于娱乐影视用途。也可以用于娱乐影视用途。也可以用于娱乐影视用途。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于梯度对抗攻击和生成对抗模型的人脸图片年龄转换方法

[0001]本专利技术属于图像合成和翻译领域，尤其涉及到人脸图像的年龄转换方法。

技术介绍

[0002]随着社会步入数字时代，人们的影视文娱活动逐渐丰富。通过人工智能方法实现人脸图片的年龄转换可以作为视频特效，广泛应用于直播平台，社交媒体中。不少影视作品需要拍摄角色从小到大的过程，而传统的手工年龄转换特效制作开销大耗时长，使用人工智能方法能够大大地降低成本。刑侦中往往遇到犯人或失踪者已经经过数十年未现身的情况，面对此问题，传统方法采用专家人工绘制年龄转换画像的方式，所需时间长且专家人数有限。使用人工智能方法可以有效解决这一问题。人脸图片年龄转换是指输入一张或多张人脸图片，对其中人脸部分进行图像翻译，以实现预测图片中人在过去或在未来的样子的任务。直到深度学习技术被广泛运用以前，人工智能方法往往只能预测成年后很小年龄跨度的人脸图片，并且只集中在人脸的纹理变化上。进入深度学习时代之后，人工智能方法有了长足的进步，实现了更大的年龄转换跨度，人脸形变等效果。但是存在模型训练时间极长，单独为人脸年龄转换设计的训练过程中抽取的特征不够具有代表性，大跨度年龄转换生成图片真实度不高，年龄转换过程中人脸身份、姿态、背景和光照不易保持等问题。因此，现有的人脸图片年龄转换技术有待提升。

技术实现思路

[0003]针对现有技术存在的以上问题，本专利技术旨在提供一种基于梯度对抗攻击和生成对抗模型的人脸图片年龄转换方法，通过使用梯度对抗攻击的方式抽取解码器、判别器、人脸识别

【技术保护点】

【技术特征摘要】
1.一种基于梯度对抗攻击和生成对抗模型的人脸图片年龄转换方法，其特征在于，所述方法包括以下步骤：步骤1：使用人脸对齐方法从在野图片中裁剪出对正的人脸图片；步骤2：选择判别器、解码器、人脸年龄估计模型和人脸身份识别模型；步骤3：使用解码器隐空间的平均向量初始化或使用更新后的隐空间向量，解码得到生成图片后输入到判别器、人脸年龄估计模型、人脸身份识别模型中取得生成图片与目标年龄的差别、生成图片真实度、生成图片的人脸身份保持度；步骤4：以目标年龄差别、生成图片真实度、人脸身份保持度加权得到优化目标，用梯度下降的方式更新隐空间向量；步骤5：重复步骤3和步骤4，直到达到算法的最大迭代数，最后取得的图片为算法的输出。2.根据权利要求1所述的一种基于梯度对抗攻击和生成对抗模型的人脸图片年龄转换方法，其特征在于：所述步骤1中，人脸对齐方法为：在野人脸图片包括人的全身，包括很多无关背景，首先使用人脸识别算法取得人脸特征点，使用SDM算法取得人脸106特征点，然后通过一组特征点的连线与水平的角度差来旋转图片，使用瞳孔连线与水平线的角度差，然后人为规定一个人脸中心，具体采用SDM算法取得106特征点，然后用瞳孔连线与水平线的角度差旋转图片，使得瞳孔连线变得水平，然后使用眉间作为人脸中心，用256
×
256大小从原图裁剪。3.根据权利要求1所述的一种基于梯度对抗攻击和生成对抗模型的人脸图片年龄转换方法，其特征在于：所述步骤2中，选用生成对抗模型中的判别器，以图片作为输入，输出一维数值，用于表示图片来自生成数据集或真实数据集的可能性，这一判别器用D表示，主要使用多层卷积神经网络，以及残差连接结构实现，运用其计算的表达式为D(x)，若输入图片x接近于虚假的生成图片，那么D(x)尽可能接近于0；若输入图片x接近于真实的图片，那么D(x)尽可能接近于1，使用带有多层卷积神经网络以及残差连接的模型，类似于StyleGAN2的判别器，输入图片为256
×
256大小的三通道RGB图片；选用解码器，将隐空间编码作为输入，输出生成的图片，使用G
θ
表示解码器，其输入隐空间编码w，得到输出图片的过程表示为：x
′
＝G
θ
(w)；输入为512维隐空间向量，生成256
×
256大小的三通道RGB图片，使用类似于StyleGAN2的生成器的解码器结构，包含有14层卷积神经网络和8层残差卷积模块，选用人脸年龄估计模型E
age
，以图片作为输入，以一定形式输出估计的年龄，使用预训练的人脸年龄估计算法DEX，以224
×
224大小的三通道彩色图片作为输入，输出101维年龄特征，包括有人脸身份估计模型E
id...

【专利技术属性】
技术研发人员：杨绍枢，永明，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人