用于生成图像的方法技术

技术编号：39726797 阅读：9 留言：0更新日期：2023-12-17 23:31

根据本公开的实施例，提供了用于生成图像的方法

全部详细技术资料下载

【技术实现步骤摘要】
用于生成图像的方法、装置、设备和存储介质

[0001]本公开的示例实施例总体涉及信息处理，并且更具体地，涉及用于生成图像的方法
、
装置
、
设备和计算机可读存储介质
。

技术介绍

[0002]随着机器学习技术的发展，已经可以利用机器学习模型来执行多种应用环境中的任务
。
基于模型的视觉任务是用于处理视觉数据，例如图像
、
视频等
。
视觉任务的示例包括但不限于图像生成
、
图像分类
、
目标检测
、
语义分割
、
光学字符识别
(OCR)
等，其中图像生成任务是视觉任务中的重要任务
。
图像生成中的艺术字图像生成由于其广泛应用而受到越来越多的关注，并且逐渐成为图像生成任务中的重要任务
。

技术实现思路

[0003]在本公开的第一方面，提供一种生成图像的方法
。
该方法包括：获取输入文本，输入文本指示生成与至少一个字符对应的图像；利用第一模型处理输入文本，以确定与至少一个字符对应的材质描述文本；获取基于材质描述文本生成的材质图像；以及基于材质图像以及与至少一个字符对应的字形图像，生成与至少一个字符对应的目标图像
。
[0004]在本公开的第二方面，提供一种用于生成图像的装置
。
该装置包括：文本获取模块，被配置为获取输入文本，输入文本指示生成与至少一个字符对应的图像...

【技术保护点】

【技术特征摘要】
1.
一种生成图像的方法，包括：获取输入文本，所述输入文本指示生成与至少一个字符对应的图像；利用第一模型处理所述输入文本，以确定与所述至少一个字符对应的材质描述文本；获取基于所述材质描述文本生成的材质图像；以及基于所述材质图像以及与所述至少一个字符对应的字形图像，生成与所述至少一个字符对应的目标图像
。2.
根据权利要求1所述的方法，其中利用第一模型处理所述输入文本包括：基于所述输入文本，生成所述第一模型的第一输入信息；以及向所述第一模型提供所述第一输入信息，以获取由所述第一模型生成的所述材质描述文本
。3.
根据权利要求2所述的方法，其中所述第一输入信息包括：预设约束信息，用于约束所述第一模型的输出生成；和
/
或一组参考材质描述文本
。4.
根据权利要求1所述的方法，其中获取基于所述材质描述文本生成的材质图像包括：向第二模型提供第二输入信息，以获取由所述第二模型生成的所述材质图像，其中所述第二输入信息基于所述材质描述文本而被生成
。5.
根据权利要求4所述的方法，其中所述第二模型包括多个卷积层，并且所述多个卷积层中的至少一个卷积层被配置为：生成与第一尺寸对应的第一特征图；以及填充所述第一特征图，以获取与第二尺寸对应的第二特征图，以作为所述至少一个卷积层的输入，所述第二尺寸大于所述第一尺寸
。6.
根据权利要求5所述的方法，其中填充所述第一特征图包括：确定所述第一特征图中的第一边缘位置；基于所述第一特征图，确定在目标方向上与所述第一边缘位置对称的第二边缘位置；以及利用所述第二边缘位置的值，填充所述第一边缘像素在所述目标方向上的相邻位置，所述相邻位置在所述第一特征图的外部
。7.
根据权利要求6所述的方法，其中所述第一边缘位置包括所述第一特征图的左边缘
、
右边缘
、
上边缘或下边缘上的位置，所述目标方向包括水平方向
、
竖直方向或对角方向中的至少一个
。8.
根据权利要求1所述的方法，还包括：基于所述输入文本和
/
或字形选择信息，从一组预设字形库中确定目标字形；以及基于所述目标字形，生成与所述至少一个字符对应的所述字形图像
。9.
...

【专利技术属性】
技术研发人员：包泽华，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人