图像生成方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36893186 阅读:44 留言:0更新日期:2023-03-15 22:08
本发明专利技术提供一种图像生成方法、装置、电子设备和存储介质,其中方法包括:获取第一文本;提取所述第一文本的文本语义特征和文本情绪特征;基于所述文本语义特征和所述文本情绪特征,生成与所述第一文本对应的第一图像。本发明专利技术提供的方法、装置、电子设备和存储介质,使得生成的第一图像能够展现出贴合第一文本的内容和情绪信息,尤其是在表情包生成场景下,能更加符合用于交互的第一文本的特质,使用于交互的表情包更有创造性。并且,即便第一文本中不包括对于人体各部分的描述,也能生成第一图像,极大扩宽了图像生成的所使用的文本范围,能够为日常聊天的交互文本提供相应的表情包生成服务,保证了图像生成的泛用性和即时性以及便捷性。及便捷性。及便捷性。

【技术实现步骤摘要】
图像生成方法、装置、电子设备和存储介质


[0001]本专利技术涉及计算机视觉
,尤其涉及一种图像生成方法、装置、电子设备和存储介质。

技术介绍

[0002]当前表情包生成方法主要是基于已有图片或视频片段素材进行参数编辑,或自动截取合适的图片,或给图片匹配对应的文字,又或者通过将表情包图片分为头型、五官、上半身等多个人体部分进行语义标注训练GAN(Generative Adversarial Network,生成对抗网络)模型合成表情包图片。
[0003]但是,生成的表情包与使用场景不匹配,创造性不足,还可能存在版权风险。并且通过划分人体部分训练模型合成表情包图片,存在较大限制,且生成内容单调,造成使用不便。比如用户在交流中使用表情包,通常会直接输入“友谊的小船说翻就翻”或“好尴尬呀”等宽泛的语义表述或情绪表达的句子,而不会对人体各部分状态做具体描述,甚至期望的生成结果也不一定是人像。

技术实现思路

[0004]本专利技术提供一种图像生成方法、装置、电子设备和存储介质,用以解决现有技术生成的表情包与使用场景不匹配,创本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法,其特征在于,包括:获取第一文本;提取所述第一文本的文本语义特征和文本情绪特征;基于所述文本语义特征和所述文本情绪特征,生成与所述第一文本对应的第一图像。2.根据权利要求1所述的图像生成方法,其特征在于,所述基于所述文本语义特征和所述文本情绪特征,生成与所述第一文本对应的第一图像,之后还包括:提取所述第一图像的图像语义特征和/或图像情绪特征;基于所述文本语义特征和所述图像语义特征之间的相似度,和/或所述文本情绪特征和所述图像情绪特征之间的相似度,确定所述第一图像的一致性得分;基于所述第一图像的一致性得分,进行图像推荐。3.根据权利要求2所述的图像生成方法,其特征在于,所述提取所述第一图像的图像语义特征和/或图像情绪特征,包括:对所述第一图像进行图像特征提取,将提取所得的图像特征作为所述图像语义特征;和/或,基于图像情绪提取模型,提取所述第一图像的图像情绪特征,所述图像情绪提取模型是人脸表情识别模型中用于提取人脸表情特征的部分。4.根据权利要求1至3中任一项所述的图像生成方法,其特征在于,所述基于所述文本语义特征和所述文本情绪特征,生成与所述第一文本对应的第一图像,包括:基于图像生成模型,确定与所述文本语义特征和所述文本情绪特征相对应的图像编码特征,并对所述图像编码特征进行解码,得到所述第一图像;所述图像生成模型是基于样本文本,以及与所述样本文本对应的样本图像进行训练得到的。5.根据权利要求4所述的图像生成方法,其特征在于,所述基于图像生成模型,确定与所述文本语义特征和所述文本情绪特征相对应的图像编码特征,并对所述图像编码特征进行解码,得到所述第一图像,包括:接收针对第二图像的编辑操作,对所述第二图像中所...

【专利技术属性】
技术研发人员:王永灿丁克玉刘权
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1