一种图像生成方法、装置、存储介质及设备制造方法及图纸

技术编号:33555722 阅读:21 留言:0更新日期:2022-05-26 22:52
本申请实施例公开了一种图像生成方法、装置、存储介质及设备,本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等场景。方法包括:获取文本集合和目标图像;目标图像包括主体对象;响应于针对文本集合和目标图像的创作生成操作,从文本集合中确定与目标图像相匹配的目标文本;获取目标图像中的非视觉显著区域,根据非视觉显著区域,在目标图像中确定用于添加目标文本的创作文本区域,将目标文本添加至目标图像中的创作文本区域中,得到创作图像。通过本申请,可以提高创作图像的生成效率,且丰富创作图像的显示效果。且丰富创作图像的显示效果。且丰富创作图像的显示效果。

【技术实现步骤摘要】
一种图像生成方法、装置、存储介质及设备


[0001]本申请涉及一种图像处理
,尤其涉及一种图像生成方法、装置、存储介质及设备。

技术介绍

[0002]随着计算机技术的迅速发展,人们的沟通方式越来越多样化,除了可以打电话、发短信之外,还可以通过各种聊天工具实现沟通交流,比如可以通过即时通信应用程序实现语音、文字的沟通。同时,为了增加聊天的趣味性,可以采用时下流行的明星、语录、动漫、影视截图为素材,配上一系列相匹配的文字,进而生成创作图像,用以表达特定的情感,创作图像能够大大增加用户之间信息交互的灵活性和趣味性。
[0003]目前,用户使用的创作图像大都是通过人工采用绘图工具、动画工具等设计和绘制而成,制作过程复杂,且受人为主观因素的影响,导致创作图像的制作效率较低,且显示效果较差。

技术实现思路

[0004]本申请实施例所要解决的技术问题在于,提供一种图像生成方法、装置、存储介质及设备,可以提高创作图像的生成效率,且丰富创作图像的显示效果。
[0005]本申请实施例一方面提供一种图像生成方法,包括:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法,其特征在于,包括:获取文本集合和目标图像;所述目标图像包括主体对象;响应于针对所述文本集合和所述目标图像的创作生成操作,从所述文本集合中确定与所述目标图像相匹配的目标文本;获取所述目标图像中的非视觉显著区域,根据所述非视觉显著区域,在所述目标图像中确定用于添加所述目标文本的创作文本区域;所述非视觉显著区域为所述目标图像中不包括所述主体对象的关键部位的区域;将所述目标文本添加至所述目标图像中的创作文本区域中,得到创作图像。2.根据权利要求1所述的方法,其特征在于,所述文本集合包括N个文本,所述N个文本包括所述目标文本;N为正整数;所述从所述文本集合中确定与所述目标图像相匹配的目标文本,包括:调用文本语义识别模型,分别对所述N个文本进行语义识别,得到每个文本对应的文本语义;调用图像语义识别模型,对所述目标图像进行语义识别,得到所述目标图像对应的图像语义;确定所述每个文本对应的文本语义分别与所述图像语义之间的图文匹配度;将所述文本集合中,具有最大图文匹配度的文本,确定与所述目标图像相匹配的目标文本。3.根据权利要求2所述的方法,其特征在于,所述调用文本语义识别模型,分别对所述N个文本进行语义识别,得到每个文本对应的文本语义,包括:调用所述文本语义识别模型中的嵌入层,分别对所述N个文本进行嵌入向量转换,得到每个文本对应的文本嵌入向量;调用所述文本语义识别模型中的自注意力特征提取层,基于所述每个文本的上下文信息和文本嵌入向量,对所述每个文本进行自注意力特征提取,得到所述每个文本对应的自注意力特征向量;调用所述文本语义识别模型中的语义分类层,对所述每个文本对应的自注意力特征向量进行语义分类,得到所述每个文本对应的文本语义。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取通用文本样本,采用所述通用文本样本对初始文本语义识别模型进行迭代训练,得到第一候选文本语义识别模型;获取用于表征对象意图的意图文本样本,采用所述意图文本样本对所述第一候选文本语义识别模型进行迭代训练,得到第二候选文本语义识别模型;获取创作图像样本,从所述创作图像样本中获取创作文本样本,采用所述创作文本样本对所述第二候选文本语义识别模型进行迭代训练,得到所述文本语义识别模型。5.根据权利要求1所述的方法,其特征在于,所述获取所述目标图像中的非视觉显著区域,包括:调用显著区域预测模型,通过所述显著区域预测模型中的区域分割层,对所述目标图像进行区域分割,得到M个候选区域;M为正整数;通过所述显著区域预测模型中的特征提取层,分别对所述M个候选区域进行特征提取,
得到每个候选区域中的主体对象的对象信息;通过所述显著区域预测模型中的分类层,对所述M个候选区域进行分类处理,得到M个候选区域分别对应的区域内容类型;根据所述对象信息和所述区域内容类型,从所述M个候选区域中确定所述目标图像中的视觉显著区域;所述视觉显著区域为所述主体对象的关键部位所在区域;将所述目标图像中除所述视觉显著区域之外的区域,确定为所述目标图像中的非视觉显著区域。6.根据权利要求5所述的方法,其特征在于,所述根据所述对象信息和所述区域内容类型,从所述M个候选区域中确定所述目标图像中的视觉显著区域,包括:通过所述显著区域预测模型中的级联层,对所述每个候选区域的对象信息和区域内容类型进行合并处理,得到所述每个候选区域的合并区域特征;根据所述每个候选区域的合并区域特征,对所述每个候选区域进行影响度预测,得到所述每个候选区域的区域影响度;将所述M个候选区域中,区域影响度大于或者等于目标阈值的候选区域,确定为所述目标图像中的视觉显著区域。7.根据权利要求1所述的方法,其特征在于,所述根据所述非视觉显著区域,在所述目标图像中确定用于添加所述目标文本的创作文本区域,包括:获取所述目标文本的文本尺寸信息;根据所述文本尺寸信息以及所述非视觉显著区域,在所述目标图像中确定用于添加所述目标文本的创作文本区域。8.根据权利要求7所述的方法,其特征在于,所述根据所述文本尺寸信息以及所述非视觉显著区域,在所述目标图像中确定用于添加所述目标文本的创作文本区域,包括:对所述目标图像中所述非视觉显著区域进行区域划分,得到Q个候选创作文本区域;Q为正整数;获取每个候选创作文本区域分别对应的区域尺寸信息;分别获取所述文本尺寸信息,与所述每个候选创作文本区域对应的区域尺寸信息之间的尺寸匹配度;根据所述尺寸匹配度,在所述Q个候选创作文本区域中选择L个尺寸匹配创作文本区域;L为小于或等于Q的正整数;在L个尺寸匹配创作文本区域中确定所述目标图像中的创作文本区域。9.根据权利要求8所述的方法,其特征在于,所述在L个尺寸匹配创作文本区域中确定所述目标图像中的创作文本区域,包括:若L为1,则将所述尺寸匹配创作文本区域确定为所述目标图像中的创作文本区域;所述尺寸匹配创作文本区域具有最大尺寸匹配度;若L大于1,则获取L个尺寸匹配创作文本区域分别在所述目标图像中的区域显示位...

【专利技术属性】
技术研发人员:肖鑫雨
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1