图像处理方法和装置制造方法及图纸

技术编号：32657928 阅读：17 留言：0更新日期：2022-03-17 11:06

公开了一种图像处理方法和装置。该图像处理方法包括：从实景图像中提取人物头像并输入给编码器，以获得第一向量；训练编辑器对第一向量进行修改，以获得第二向量，其中，所述修改参考基于用户需求构建的自然语言格式的描述文本，并且基于第二向量生成的人物头像与所述描述文本的接近程度达到设定要求；将第二向量提供给生成指定图像处理模型，以得到修正头像；将修正头像和实景图像中的人物头像融合，以获得新的实景图像。和现有技术相比，本公开实施例通过自然语言监督编辑器对头像的隐变量进行编辑以生成符合要求的人物头像，并通过头像融合获得的新的实景图像的自然程度。头像融合获得的新的实景图像的自然程度。头像融合获得的新的实景图像的自然程度。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法和装置

[0001]本公开涉及神经网络和图像处理结合的应用领域，具体而言，涉及一种图像处理方法和装置。

技术介绍

[0002]对于企业来说，已经拍摄好的物料(包括海报、视频、宣传单等等)，如果重新进行拍摄则需要花费大量的人力物力，但在某些情况下，又不得不拍摄新的物料，例如产品进入一个新的国家，往往需要采用当地的模特拍摄新的宣传海报。
[0003]随着神经网络的快速应用，利用图像处理模型已经能够生成高清的人脸图像，但完成实景模特的人物头像生成和替换仍面临以下几个困难：1)原有的物料中模特往往有着特定的姿势，为了保证好的替换效果，如何可控地生成相同姿势下的人脸是一个难点；2)不同的需求方对人物形象有着不同的要求，如脸型，发色，眼睛等，如何生成对应要求的人物头像是另一难点。

技术实现思路

[0004]有鉴于此，本公开提供一种图像处理方法和装置，以可控地生成人物头像并替换掉实景模特的人物头像。
[0005]根据本公开实施例的第一方面，提供一种图像处理方法，包括：
[0006]从实景图像中提取人物头像并输入给编码器，以获得第一向量；
[0007]训练编辑器对所述第一向量进行修改，以获得第二向量，其中，所述修改参考基于用户需求构建的自然语言格式的描述文本，并且基于所述第二向量生成的人物头像与所述描述文本的接近程度达到设定要求；
[0008]将所述第二向量提供给指定图像处理模型，以得到修正头像；
[0009]基于所述修正头像和所述实景图像中的人物头像融合，...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法，包括：从实景图像中提取人物头像并输入给编码器，以获得第一向量；训练编辑器对所述第一向量进行修改，以获得第二向量，其中，所述修改参考基于用户需求构建的自然语言格式的描述文本，并且基于所述第二向量生成的人物头像与所述描述文本的接近程度达到设定要求；将所述第二向量提供给指定图像处理模型，以得到修正头像；基于所述修正头像和所述实景图像中的人物头像融合，以获得新的实景图像。2.根据权利要求1所述的图像处理方法，其中，所述从实景图像中提取人物头像包括：利用人脸关键点检测人脸的多个关键点并据此截取所述人物头像。3.根据权利要求2所述的图像处理方法，其中，所述从实景图像中提取人物头像还包括：根据检测到的人脸的关键点将脸部转正对齐。4.根据权利要求1所述的图像处理方法，其中，所述图像处理方法还包括：从图片库获取与所述描述文本部分相符的多个样本头像并输入给编码器，以获得多个第三向量；则在所述训练编辑器对所述第一向量进行修改的步骤中，基于所述多个第三向量与所述第二向量之间的欧式距离建立损失函数。5.根据权利要求1所述的图像处理方法，其中，所述编辑器、所述指定图像处理模型、文本编码器、图像编码器和图文相似度模型组成第一网络结构，通过对所述第一网络结构进行训练来训练所述编辑器，并且，所述第一网络结构的损失函数基于以下项目构建：所述第二向量和所述第一向量之间的欧式距离、所述指定图像处理模型输出的重建头像和所述实景图像的人物头像之间的人脸相似度以及所述描述文本与所述指定图像处理模型输出的重建头像之间的图文相关性。6.根据权利要求1至5任一项所述的图像处理方法，其中，所述指定图像处理模型为生成对抗网络中的生成模型，所述第一向量和所述第二向量符合生成对抗网络隐空间的隐变量的要求。7.根据权利要求1所述的图像处理方法，所述基于所述修正头像和所述实景图像中的人物头像融合包括：采用二次重...

【专利技术属性】
技术研发人员：白帅，周慧玲，薛金宝，周畅，杨红霞，周靖人，
申请(专利权)人：阿里巴巴云计算北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人