一种捏脸方法、捏脸系统及存储介质技术方案

技术编号:35174325 阅读:19 留言:0更新日期:2022-10-12 17:40
本发明专利技术涉及自然语言领域,特别涉及一种捏脸方法、捏脸系统及存储介质,本发明专利技术的捏脸方法包括以下步骤:获取对目标人脸图像的自然语言描述;随机生成一组人脸图像;计算自然语言描述与一组人脸图像中各图像的相关性;筛选相关性高于预设阈值的人脸图像,以相关性最高的人脸图像作为第一目标人脸图像。本发明专利技术通过用户输入自然语言描述即可获得用户想象中的目标人脸图像,操作简单;此外,本发明专利技术获取第一目标人脸图像的时候就已经考虑到人脸图像与自然语言描述之间的相关性,因此获取的第一目标人脸图像效果更好。本发明专利技术还提供一种捏脸系统与存储介质,该捏脸系统与存储介质与上述捏脸方法具有相同的有益效果。方法具有相同的有益效果。方法具有相同的有益效果。

【技术实现步骤摘要】
一种捏脸方法、捏脸系统及存储介质


[0001]本专利技术涉及人脸图像生成
,特别涉及一种捏脸方法、捏脸系统及存储介质。

技术介绍

[0002]捏脸在网络游戏中泛指对虚拟角色样貌进行DIY的数据操作,目前,用户在进入游戏或者登录某个网站或进入元宇宙空间时,想要一个想象中的人脸图像作为头像需要通过满是复杂的拖动条的控制面板来生成用户预期的头像,而对于一般的用户而已,这种操作方式较为复杂,且最终获得的头像往往与用户想象中的样子相差较大。

技术实现思路

[0003]为降低捏脸难度,本专利技术提供了一种捏脸方法、捏脸系统及存储介质。
[0004]本专利技术解决技术问题的方案是提供一种捏脸方法,包括以下步骤:获取对目标人脸图像的自然语言描述;随机生成一组人脸图像;计算所述自然语言描述与所述一组人脸图像中各图像的相关性;筛选相关性高于预设阈值的人脸图像,以相关性最高的人脸图像作为第一目标人脸图像。
[0005]优选地,筛选相关性高于预设阈值的人脸图像,以相关性最高的人脸图像作为第一目标人脸图像之后还包括以下步骤:判断是否有新的对人像的自然语言描述;若有,则获取新的对人像的自然语言描述并基于新的对人像的自然语言描述对第一目标人脸图像进行修改得到第二目标人脸图像。
[0006]优选地,所述自然语言描述的包括语音模态的自然语言描述以及文本模态的自然语言描述。
[0007]优选地,随机生成一组人脸图像的步骤包括;通过对抗网络生成器随机生成一组人脸图像。
[0008]优选地,计算所述自然语言描述与所述一组人脸图像中各图像的相关性的步骤包括:通过多模态双塔架构模型逐一计算所述自然语言描述与所述一组人脸图像中各图像的相关性。
[0009]优选地,计算所述自然语言描述与所述一组人脸图像中各图像的相关性之后的步骤还包括:判断所述自然语言描述与所述一组人脸图像中各图像的相关性是否超过预设阈值;若所述自然语言描述与所述一组人脸图像中各图像之间的相关性均未超过预设
阈值,则重新生成一组新的人脸图像。
[0010]本专利技术为解决上述技术问题还提供一种捏脸系统,包括输入模块、人像生成模块、文本与图像匹配模块;所述文本与图像匹配模块分别与所述输入模块以及所述人像生成模块信号连接;所述输入模块用于获取自然语言描述;所述人像生成模块用于随机生成一组人脸图像;所述文本与图像匹配模块用于获取第一目标人脸图像。
[0011]优选地,所述捏脸系统还包括优化模块,所述优化模块分别与所述输入模块以及所述文本与图像匹配模块信号连接;所述优化模块用于对第一目标人脸图像进行修改得到第二目标人脸图像。
[0012]优选地,所述文本与图像匹配模块包括比较模块,所述比较模块用于比较对目标人脸图像的自然语言描述与所述一组人脸图像中各图像之间的相关性是否大于预设阈值;所述自然语言描述包括文本模态的自然语言描述与语音模态的自然语言描述;所述输入模块包括语音转文字模块,所述语音转文字模块用于将语音模态的自然语言描述转换成文本模态的自然语言描述。
[0013]本专利技术为解决上述技术问题还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述捏脸方法。
[0014]与现有技术相比,本专利技术的一种捏脸方法、捏脸系统及存储介质具有以下优点:1、本专利技术的捏脸方法包括以下步骤:获取对目标人脸图像的自然语言描述;随机生成一组人脸图像;计算自然语言描述与一组人脸图像中各图像的相关性;筛选相关性高于预设阈值的人脸图像,以相关性最高的人脸图像作为第一目标人脸图像。可以理解,使用本专利技术的捏脸方法用户通过直接输入自然语言描述即可生成和调整人脸图像以获取用户想要的人脸图像即第一目标人脸图像或第二目标人脸图像,而无需通过满是复杂的拖动条的控制面板来进行捏脸,极大地降低了捏脸难度进而降低了用户操作门槛。另外,本专利技术在获取第一目标人脸图像时就已经考虑到了第一目标人脸图像与目标人脸图像的自然语言描述之间的相关性,不仅提高了第一目标人脸图像的生成效率,同时第一目标人脸图像与目标人脸图像的自然语言描述十分接近,极大地提高了第一目标人脸图像的生成效果,并且可能出现第一目标人脸图像即为用户想要的人脸图像的情况。
[0015]2、本专利技术筛选相关性高于预设阈值的人脸图像,以相关性最高的人脸图像作为第一目标人脸图像之后还包括以下步骤:判断是否有新的对人像的自然语言描述;若有,则获取新的对人像的自然语言描述并基于新的对人像的自然语言描述对第一目标人脸图像进行修改得到第二目标人脸图像。可以理解,在第一目标人脸图像不符合用户预期的情况下,用户会输入新的对人像的自然语言描述对第一目标人脸图像进行修改获得用户预期人脸图像即第二目标人脸图像,极大地提高了用户获得预期人脸图像的可能性。
[0016]3、本专利技术的自然语言描述的包括语音模态的自然语言描述以及文本模态的自然语言描述,因此用户除了可以通过输入对人像的文字描述生成和调整人脸图像外,还可以通过语音直接说出对人像的描述生成和调整人脸图像,因此,通过本专利技术提供的语音交互形式来生成和调整头像就是一种更便捷灵活的方式;在用户凭想象想要构建虚拟形象时,可以零门槛通过本专利技术的语音交互形式来生成想要的虚拟形象,如软件中使用到的客服形
象、客服头像等,交互方便无门槛,灵活易用。
[0017]4、本专利技术随机生成一组人脸图像的步骤包括;通过对抗网络生成器随机生成一组人脸图像。本专利技术通过对抗网络中的生成器生成的一组人脸图像为虚假的人脸图像,避免了侵犯肖像权的问题出现。
[0018]5、本专利技术计算自然语言描述与一组人脸图像中各图像的相关性的步骤包括:通过多模态双塔架构模型逐一计算自然语言描述与一组人脸图像中各图像的相关性,有利于提高初始目标人脸图像生成的效率以及初始目标人脸图像的生成效果。
[0019]6、本专利技术计算自然语言描述与一组人脸图像中各图像的相关性之后的步骤还包括:判断自然语言描述与一组人脸图像中各图像的相关性是否超过预设阈值;若自然语言描述与一组人脸图像中各图像之间的相关性均未超过预设阈值,则重新生成一组新的人脸图像。本专利技术通过多次随机生成一组人脸图像,直至得到相关性与对目标人脸图像的自然语言描述大于预设阈值的图像,将其作为第一目标人脸图像,若一组人脸图像中存在多个与对人像的自然语言描述相关性大于预设阈值的人脸图像,则将其中相关性最高的人脸图像作为第一目标人脸图像,可以极大地提高第一目标人脸图像的生成效果。
[0020]7、本专利技术还提供一种捏脸系统,具有与上述捏脸方法相同的有益效果,在此不做赘述。
[0021]8、本专利技术还提供一种存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述捏脸方法,具有与上述捏脸方法相同的有益效果,此处不再赘述。
附图说明
[0022]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种捏脸方法,其特征在于:包括以下步骤:获取对目标人脸图像的自然语言描述;随机生成一组人脸图像;计算所述自然语言描述与所述一组人脸图像中各图像的相关性;筛选相关性高于预设阈值的人脸图像,以相关性最高的人脸图像作为第一目标人脸图像。2.如权利要求1所述的捏脸方法,其特征在于:筛选相关性高于预设阈值的人脸图像,以相关性最高的人脸图像作为第一目标人脸图像之后还包括以下步骤:判断是否有新的对人像的自然语言描述;若有,则获取新的对人像的自然语言描述并基于新的对人像的自然语言描述对第一目标人脸图像进行修改得到第二目标人脸图像。3.如权利要求1所述的捏脸方法,其特征在于:所述自然语言描述的包括语音模态的自然语言描述以及文本模态的自然语言描述。4.如权利要求1所述的捏脸方法,其特征在于:随机生成一组人脸图像的步骤包括;通过对抗网络生成器随机生成一组人脸图像。5.如权利要求1所述的捏脸方法,其特征在于:计算所述自然语言描述与所述一组人脸图像中各图像的相关性的步骤包括:通过多模态双塔架构模型逐一计算所述自然语言描述与所述一组人脸图像中各图像的相关性。6.如权利要求1所述的捏脸方法,其特征在于:计算所述自然语言描述与所述一组人脸图像中各图像的相关性之后的步骤还包括:判断所述自然语言描述与所述一组人脸图像中各图像的相关性...

【专利技术属性】
技术研发人员:华菁云王宇龙马超周明
申请(专利权)人:北京澜舟科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1