生成人像图像的方法、装置、可读介质和电子设备制造方法及图纸

技术编号:27474317 阅读:27 留言:0更新日期:2021-03-02 17:41
本申请公开了一种生成人像图像的方法、装置、可读介质和电子设备,应用于图像生成领域。通过控制输入到生成器的网络单元中的目标噪声向量,使得生成的人像图像库特征质量合格、丰富度足够泛化、数量足够充足。具体的,该方法包括:获取多个随机噪声向量;对多个随机噪声向量进行非线性变换得到多个目标噪声向量,多个随机噪声向量与多个目标噪声向量一一对应;根据多个目标噪声向量,得到多组向量序列,其中每组向量序列中包含的目标噪声向量的数量均为n,且不同向量序列中包含的目标噪声向量不同,n为大于或等于2的正整数;基于多组向量序列生成多个人像图像,多组向量序列与多个人像图像一一对应。具体的,该方法应用于生成人像图像的场景中。像图像的场景中。像图像的场景中。

【技术实现步骤摘要】
生成人像图像的方法、装置、可读介质和电子设备


[0001]本申请涉及图像生成领域,特别涉及一种生成人像图像的方法、装置、可读介质和电子设备。

技术介绍

[0002]随着人脸识别技术在安防,金融等领域大量落地应用,对人脸识别技术相关的产品的质量要求也随之变高。通常以产品使用的人脸识别模型支持的精度以及底库(即人像数据库)规模作为衡量产品质量的重要指标。例如,在人脸识别模型中使用人像聚档技术,有利于提高人像识别的精度,以及提升人像库规模。其中,人像聚档指利用人脸识别模型对数据库中人像根据特征相似度计算得到同一人的不同照片,并归入一个档案。
[0003]具体的,实际产品通常需要支持大规模人像库聚档,而发布支持大规模人像库聚档的模型需要更大规模的人像库进行质量测试验收。然而,人脸数据因涉及个人隐私而被政府保护,从而获取困难、资源稀缺且无法形成市场,进而导致规模较大的人像库难以获取。如果考虑伪造虚拟人脸用于人像聚档对应模型的测试,那么由于采用像素融合、区域裁切替等图像处理领域的通用技术伪造虚拟人脸时无法形成新的人脸特征,将导致生成的虚拟人脸无法用于人像聚档验证。
[0004]如此,如何获取规模足够大的人像数据库,尤其是人像特征质量合格、丰富度足够泛化、数量足够充足的人像数据库,成为保障大规模聚档模型算法的质量面临的难题。

技术实现思路

[0005]本申请的一些实施例提供了一种生成人像图像的方法、装置、可读介质和电子设备,以下从多个方面介绍本申请,以下多个方面的实施方式和有益效果可互相参考。/>[0006]第一方面,本申请的实施方式提供了一种生成人像图像的方法,该方法包括:获取多个随机噪声向量;对该多个随机噪声向量进行非线性变换得到多个目标噪声向量,其中该多个随机噪声向量与该多个目标噪声向量一一对应;根据该多个目标噪声向量,得到多组向量序列,其中每组向量序列中包含的目标噪声向量的数量均为n,且不同向量序列中包含的目标噪声向量不同,n为大于或等于2的正整数;基于该多组向量序列生成多个人像图像,该多组向量序列与多个人像图像一一对应。
[0007]根据本申请的实施方式,将随机噪声向量通过非线性变换得到多个目标噪声向量,并针对多个目标噪声向量进行组合和排序,得到多组向量序列,基多组向量序列生成一一对应的人像图片,因为输入的向量序列不同也无规律,使得生成的人像图像之间的特征泛性增强。
[0008]在一些实施方式中,上述生成人像图像的方法是基于生成网络实现,该生成网络包括串联的n层神经网络单元,该n层神经网络单元中的前一层神经网络单元的输出作为后一层神经网络单元的输入;上述基于多组向量序列生成多个人像图像,包括:将每组向量序列中的n个目标噪声向量按照排列顺序依次输入至n层神经网络单元中,并将预设向量输入
至n层神经网络单元中的第一层神经网络单元,使得n层神经网络单元中的最后一层神经网络单元输出一个人像图像,得到多个人像图像。
[0009]在一些实施方式中,上述生成人像图像的方法中:多个随机噪声向量和多个目标噪声向量中向量数量均为n,多组向量序列的组数和多个人像图像的个数为n!,并且每组向量序列中均包含多个目标噪声向量中的所有目标噪声向量。
[0010]在一些实施方式中,上述生成人像图像的方法中,多个随机噪声向量中每个随机噪声向量的数据结构均为1
×
n维。
[0011]在一些实施方式中,上述生成人像图像的方法中,生成网络基于反卷积网络实现。
[0012]在一些实施方式中,上述生成人像图像的方法中,基于多组向量序列生成多个人像图像之前,该方法还包括:将第一随机噪声向量输入至生成网络,并将真实的人像图像输入至判别网络中,其中生成网络和判别网络包含于同一生成对抗网络;通过生成网络对第一随机噪声向量进行非线性变换,得到第一目标噪声向量;将第一目标噪声向量输入n层神经网络单元中的每层神经网络单元中,并将预设向量输入至第一层神经网络单元中,使得最后一层神经单元输出一个第一人像图像;将第一人像图像输入判别网络;通过判别网络区分真实的人像图像和第一人像图像,得到判别结果;若判别结果指示判别网络能够区分人像图像和真实的人像图像,则更新生成网络的参数和/或判别网络的参数;若判别结果指示判别网络无法区分人像图像和真实的人像图像,则导出生成网络。
[0013]在一些实施方式中,上述生成人像图像的方法中,非线性变换是基于至少一层全连接网络实现。
[0014]第二方面,本申请的实施方式提供了一种生成人像图像的装置,该装置包括:获取单元,用于获取多个随机噪声向量;非线性变换单元,用于对获取单元获取的多个随机噪声向量进行非线性变换得到多个目标噪声向量,其中多个随机噪声向量与多个目标噪声向量一一对应;输入单元,用于根据非线性单元得到多个目标噪声向量,得到多组向量序列,其中每组向量序列中包含的目标噪声向量的数量均为n,n为大于或等于2的正整数;生成单元,用于基于多组向量序列生成多个人像图像,多组向量序列与多个人像图像一一对应。
[0015]在一些实施方式中,上述生成人像图像的装置中包括生成网络,其中生成网络包括串联的n层神经网络单元,n层神经网络单元中的前一层神经网络单元的输出作为后一层神经网络单元的输入;生成单元,具体用于将每组向量序列中的n个目标噪声向量按照排列顺序依次输入至n层神经网络单元中,并将预设向量输入至n层神经网络单元中的第一层神经网络单元,使得n层神经网络单元中的最后一层神经网络单元输出一个人像图像,得到多个人像图像。
[0016]在一些实施方式中,上述生成人像图像的装置中,多个随机噪声向量和多个目标噪声向量中向量数量均为n,多组向量序列的组数和多个人像图像的个数为n!,并且每组向量序列中均包含多个目标噪声向量中的所有目标噪声向量。
[0017]在一些实施方式中,上述生成人像图像的装置中,多个随机噪声向量中每个随机噪声向量的数据结构均为1
×
n维。
[0018]在一些实施方式中,上述生成人像图像的装置中,生成网络基于反卷积网络实现。
[0019]在一些实施方式中,上述生成人像图像的装置中,获取单元,还用于在生成单元基于多组向量序列生成多个人像图像之前,将第一随机噪声向量输入至生成网络,并将真实
的人像图像输入至判别网络中,其中生成网络和判别网络包含于同一生成对抗网络;非线性变换单元,还用于通过生成网络对获取单元获取的第一随机噪声向量进行非线性变换,得到第一目标噪声向量;输入单元,还用于将非线性单元得到的第一目标噪声向量输入n层神经网络单元中的每层神经网络单元中,并将预设向量输入至第一层神经网络单元中,使得最后一层神经单元输出一个第一人像图像;上述装置还包括:第一输入单元,用于将第一人像图像输入判别网络;判别单元,用于通过判别网络区分真实的人像图像和第一人像图像,得到判别结果;若判别结果指示判别网络能够区分人像图像和真实的人像图像,则更新生成网络的参数和/或判别网络的参数;若判别结果指示判别网络无法区分人本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种生成人像图像的方法,其特征在于,所述方法包括:获取多个随机噪声向量;对所述多个随机噪声向量进行非线性变换得到多个目标噪声向量,其中所述多个随机噪声向量与所述多个目标噪声向量一一对应;根据所述多个目标噪声向量,得到多组向量序列,其中每组向量序列中包含的目标噪声向量的数量均为n,且不同向量序列中包含的目标噪声向量不同,n为大于或等于2的正整数;基于所述多组向量序列生成多个人像图像,所述多组向量序列与所述多个人像图像一一对应。2.根据权利要求1所述的方法,其特征在于,所述方法基于生成网络实现,其中所述生成网络包括串联的n层神经网络单元,所述n层神经网络单元中的前一层神经网络单元的输出作为后一层神经网络单元的输入;所述基于所述多组向量序列生成多个人像图像,包括:将每组向量序列中的n个目标噪声向量按照排列顺序依次输入至所述n层神经网络单元中,并将预设向量输入至所述n层神经网络单元中的第一层神经网络单元,使得所述n层神经网络单元中的最后一层神经网络单元输出一个人像图像,得到所述多个人像图像。3.根据权利要求2所述的方法,其特征在于,所述多个随机噪声向量和所述多个目标噪声向量中向量数量均为n,所述多组向量序列的组数和所述多个人像图像的个数为n!,并且每组向量序列中均包含所述多个目标噪声向量中的所有目标噪声向量。4.根据权利要求3所述的方法,所述多个随机噪声向量中每个随机噪声向量的数据结构均为1
×
n维。5.根据权利要求4所述的方法,其特征在于,所述生成网络基于反卷积网络实现。6.根据权利要求2至5中任一项所述的方法,其特征在于,所述基于所述多组向量序列生成多个人像图像之前,所述方法还包括:将第一随机噪声向量输入至所述生成网络,并将真实的人像图像输入至判别网络中,其中所述生成网络和所述判别网络包含...

【专利技术属性】
技术研发人员:殷书宝叶芳
申请(专利权)人:上海依图网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1