人脸识别数据集的生成方法及装置、电子设备及存储介质制造方法及图纸

技术编号:33785582 阅读:86 留言:0更新日期:2022-06-12 14:40
本申请涉及人脸识别技术领域,公开一种人脸识别数据集的生成方法,包括:将随机生成的第一潜在编码输入至预设的生成器中,得到所述生成器输出的第一人脸图片;根据至少一类人脸属性更新所述第一潜在编码,生成第二潜在编码;将所述第二潜在编码输入至预设的生成器中,得到所述生成器输出的第二人脸图片;在确定所述第一人脸图片和第二人脸图片属于同一人脸身份信息的情况下,保存所述第一人脸图片和第二人脸图片以生成目标人脸识别数据集。该方法既节省了人力成本,又解决了人脸图像质量较差、单个人脸图片数目较少、数据集中存在重复到的人脸身份信息等各种问题。本申请还公开一种人脸识别数据集的生成装置、电子设备及存储介质。储介质。储介质。

【技术实现步骤摘要】
人脸识别数据集的生成方法及装置、电子设备及存储介质


[0001]本申请涉及人脸识别
,例如涉及一种人脸识别数据集的生成方法及装置、电子设备及存储介质。

技术介绍

[0002]目前,人脸识别系统已经应用在人们生活中点的诸多领域,例如电子识别解锁、门禁打卡和金融支付等。训练一个人脸识别模型通常需要收集大量的人脸身份信息,每个人脸身份信息需要包含同一个人的多张不同的人脸图片。同理可知,人脸识别模型的准确率非常依赖训练时用到的人脸识别数据集。通常而言,人脸识别数据集中的人脸身份信息的数目越多,每个人脸身份信息包含的人脸图片越多,那么这个人脸识别数据集就能更好地代表真实情况下的人脸特征分布。因此,如何有效地扩充人脸识别数据集的大小,对于人脸识别模型的准确率至关重要。
[0003]在实现本申请的过程中,发现相关技术中至少存在如下问题:
[0004]现有的人脸识别数据集,例如Glint360K和WebFace260M,通常是人工采集或者从互联网抓取得到,这种方式采集数据需要非常大的人力成本,且采集到的数据中会存在人脸图像质量较差、单个人脸图片数目较少、数据集中存在重复到的人脸身份信息等各种问题。

技术实现思路

[0005]为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
[0006]本申请提供了一种人脸识别数据集的生成方法及装置、电子设备及存储介质,以减少采集数据的成本并提高人脸识别数据集中的人脸图像质量。
[0007]在一些实施例中,所述人脸识别数据集的生成方法,包括:
[0008]将随机生成的第一潜在编码输入至预设的生成器中,得到所述生成器输出的第一人脸图片;
[0009]根据至少一类人脸属性更新所述第一潜在编码,生成第二潜在编码;
[0010]将所述第二潜在编码输入至预设的生成器中,得到所述生成器输出的第二人脸图片;
[0011]在确定所述第一人脸图片和第二人脸图片属于同一人脸身份信息的情况下,保存所述第一人脸图片和第二人脸图片以生成目标人脸识别数据集。
[0012]可选地,所述根据至少一类人脸属性更新所述第一潜在编码,生成第二潜在编码,包括:
[0013]根据所述至少一类人脸属性中的任一人脸属性,确定修改第一潜在编码的扰动方向和扰动程度;
[0014]根据所述扰动方向和扰动程度对所述第一潜在编码进行变换,生成第二潜在编码。
[0015]可选地,在将随机生成的第一潜在编码输入至预设的生成器中,得到所述生成器输出的第一人脸图片之前,还包括:
[0016]从开源人脸识别数据集中获取多张真实的人脸图片;
[0017]根据所述多张真实的人脸图片,训练一个生成对抗网络并保留所述生成对抗网络中的生成器;
[0018]以残差网络模型为主干,训练得到一个人脸识别模型。
[0019]可选地,所述在确定所述第一人脸图片和第二人脸图片属于同一人脸身份信息的情况下,保存所述第一人脸图片和第二人脸图片以生成目标人脸识别数据集,包括:
[0020]将所述第一人脸图片输入至所述人脸识别模型中,得到所述第一人脸图片对应的第一特征表达;
[0021]将所述第二人脸图片输入至所述人脸识别模型中,得到所述第二人脸图片对应的第二特征表达;
[0022]计算所述第一特征表达和第二特征表达之间的余弦相似度;
[0023]在所述余弦相似度小于相似度阈值的情况下,保存所述第一人脸图片和第二人脸图片以生成目标人脸识别数据集。
[0024]在一些实施例中,所述人脸识别数据集的生成装置,包括:
[0025]第一图片生成模块,被配置为将随机生成的第一潜在编码输入至预设的生成器中,得到所述生成器输出的第一人脸图片;
[0026]扰动添加模块,被配置为根据至少一类人脸属性更新所述第一潜在编码,生成第二潜在编码;
[0027]第二图片生成模块,被配置为将所述第二潜在编码输入至预设的生成器中,得到所述生成器输出的第二人脸图片;
[0028]数据集生成模块,被配置为在确定所述第一人脸图片和第二人脸图片属于同一人脸身份信息的情况下,保存所述第一人脸图片和第二人脸图片以生成目标人脸识别数据集。
[0029]可选地,所述扰动添加模块,具体被配置为:
[0030]根据所述至少一类人脸属性中的任一人脸属性,确定修改第一潜在编码的扰动方向和扰动程度;
[0031]根据所述扰动方向和扰动程度对所述第一潜在编码进行变换,生成第二潜在编码。
[0032]可选地,所述装置还包括预训练模块,所述预训练模块被配置为:
[0033]从开源人脸识别数据集中获取多张真实的人脸图片;
[0034]根据所述多张真实的人脸图片,训练一个生成对抗网络并保留所述生成对抗网络中的生成器;
[0035]以残差网络模型为主干,训练得到一个人脸识别模型。
[0036]可选地,所述数据集生成模块,被配置为:
[0037]将所述第一人脸图片输入至所述人脸识别模型中,得到所述第一人脸图片对应的
第一特征表达;
[0038]将所述第二人脸图片输入至所述人脸识别模型中,得到所述第二人脸图片对应的第二特征表达;
[0039]计算所述第一特征表达和第二特征表达之间的余弦相似度;
[0040]在所述余弦相似度小于相似度阈值的情况下,保存所述第一人脸图片和第二人脸图片以生成目标人脸识别数据集。
[0041]在一些实施例中,所述电子设备,包括存储器和处理器,其中:
[0042]所述存储器,用于保存计算机程序;
[0043]所述处理器,用于执行所述计算机程序,以实现如本申请所述的人脸识别数据集的生成方法。
[0044]在一些实施例中,所述存储介质,存储有程序指令,所述程序指令在运行时,执行如本申请所述的人脸识别数据集的生成方法。
[0045]本申请提供的人脸识别数据集的生成方法及装置、电子设备及存储介质,可以实现以下技术效果:
[0046]本申请采用应用于机器学习
的技术手段,通过生成对抗网络的生成器生成的第一人脸图片,然后通过图片编辑技术根据至少一类人脸属性对第一人脸图片进行修改,以通过生成器生成同一人脸身份信息的生成的第二人脸图片,进而实现人脸识别数据集的生成,既节省了人力成本,又解决了人脸图像质量较差、单个人脸图片数目较少、数据集中存在重复到的人脸身份信息等各种问题,还能够保护采集对象的人脸生物特征隐私。
[0047]以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
[0048]一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人脸识别数据集的生成方法,其特征在于,包括:将随机生成的第一潜在编码输入至预设的生成器中,得到所述生成器输出的第一人脸图片;根据至少一类人脸属性更新所述第一潜在编码,生成第二潜在编码;将所述第二潜在编码输入至预设的生成器中,得到所述生成器输出的第二人脸图片;在确定所述第一人脸图片和第二人脸图片属于同一人脸身份信息的情况下,保存所述第一人脸图片和第二人脸图片以生成目标人脸识别数据集。2.根据权利要求1所述的生成方法,其特征在于,所述根据至少一类人脸属性更新所述第一潜在编码,生成第二潜在编码,包括:根据所述至少一类人脸属性中的任一人脸属性,确定修改第一潜在编码的扰动方向和扰动程度;根据所述扰动方向和扰动程度对所述第一潜在编码进行变换,生成第二潜在编码。3.根据权利要求1或2所述的生成方法,其特征在于,在将随机生成的第一潜在编码输入至预设的生成器中,得到所述生成器输出的第一人脸图片之前,还包括:从开源人脸识别数据集中获取多张真实的人脸图片;根据所述多张真实的人脸图片,训练一个生成对抗网络并保留所述生成对抗网络中的生成器;以残差网络模型为主干,训练得到一个人脸识别模型。4.根据权利要求3所述的生成方法,其特征在于,所述在确定所述第一人脸图片和第二人脸图片属于同一人脸身份信息的情况下,保存所述第一人脸图片和第二人脸图片以生成目标人脸识别数据集,包括:将所述第一人脸图片输入至所述人脸识别模型中,得到所述第一人脸图片对应的第一特征表达;将所述第二人脸图片输入至所述人脸识别模型中,得到所述第二人脸图片对应的第二特征表达;计算所述第一特征表达和第二特征表达之间的余弦相似度;在所述余弦相似度小于相似度阈值的情况下,保存所述第一人脸图片和第二人脸图片以生成目标人脸识别数据集。5.一种人脸识别数据集的生成装置,其特征在于,包括:第一图片生成模块,被配置为将随机生成的第一潜在编码输入至预设的生成器中,...

【专利技术属性】
技术研发人员:刘星赵晨旭唐大闰
申请(专利权)人:北京明略昭辉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1