当前位置: 首页 > 专利查询>OPPO专利>正文

基于文本生成图像的方法技术

技术编号：39818252 阅读：9 留言：0更新日期：2023-12-22 19:37

本申请实施例提供一种基于文本生成图像的方法

全部详细技术资料下载

【技术实现步骤摘要】
基于文本生成图像的方法、装置、电子设备及存储介质

[0001]本申请涉及人工智能绘图
，更具体地，涉及一种基于文本生成图像的方法
、
装置
、
电子设备及存储介质
。

技术介绍

[0002]人工智能绘图技术包括基于图像生成图像技术以及基于文本生成图像技术
。
基于图像生成图像是指根据用户输入原始图像生成新图像，例如，根据用户输入的人像图片生成动画形象图片
。
基于文本生成图像是指根据用户输入的文本生成图像的技术，例如，根据用户输入的一段文字生成与该文字对应的图像
。
[0003]本申请涉及人工智能绘图技术中的基于文本生成图像技术
。
基于文本生成图像技术可以应用于不同场景中，例如，手机主题商店个性化壁纸创作，微软办公演示文稿
(Microsoft Office PowerPoint
，简称
PPT)
中的创意图像素材创作，虚拟空间中的图像内容创作，以及多模态的对话交互系统等
。

技术实现思路

[0004]本申请实施例提供一种基于文本生成图像的方法
、
装置
、
电子设备及存储介质，以实现端到端的基于文本生成高度可控的图像的功能，提升基于文本生成图像的效率以及准确性
。
[0005]第一方面，本申请实施例提供一种基于文本生成图像的方法，该方法包括：响应于接收到描述性文本，提取所述描述性文本中的实体标记以及与所...

【技术保护点】

【技术特征摘要】
1.
一种基于文本生成图像的方法，其特征在于，包括：响应于接收到描述性文本，提取所述描述性文本中的实体标记以及与所述实体标记对应的实体位置信息，所述实体标记用于描述实体；在图像库中搜索与所述实体标记对应的目标图像，所述图像库中的每个图像对应一个实体标记且包括所对应的实体标记描述的实体；根据所述实体标记
、
与所述实体标记对应的所述实体位置信息
、
所述目标图像，生成与所述描述性文本对应的图像
。2.
根据权利要求1所述的方法，其特征在于，所述实体位置信息包括检测框，所述在图像库中搜索与所述实体标记对应的目标图像之后，所述方法还包括：针对每个实体标记，从搜索到的与该实体标记对应的图像中，获取与该实体标记对应的检测框尺寸相同的图像，作为最终与该实体标记对应的目标图像
。3.
根据权利要求1所述的方法，其特征在于，所述在图像库中搜索与所述实体标记对应的目标图像之前，所述方法还包括：获取样本图像，所述样本图像包括至少一个实体；对所述样本图像进行分割，得到至少一个分割图像以及至少一个实体标记，每个分割图像对应一个实体标记且包括该实体标记描述的实体；将至少一个实体标记作为搜索条件，将至少一个分割图像作为搜索结果，构建所述图像库
。4.
根据权利要求3所述的方法，其特征在于，所述对所述样本图像进行分割，得到至少一个分割图像以及至少一个实体标记，包括：根据所述样本图像，生成关于所述样本图像的描述性文本；从关于所述样本图像的描述性文本中，提取实体标记以及实体位置信息，实体位置信息和实体标记存在一对一映射关系；根据关于所述样本图像的描述性文本
、
提取到的实体标记以及实体位置信息生成可执行文本；根据所述可执行文本对所述样本图像进行分割，得到至少一个分割图像以及至少一个实体标记
。5.
根据权利要求1所述的方法，其特征在于，所述提取所述描述性文本中的实体标记以及与所述实体标记对应的实体位置信息，包括：采用大型语言模型，提取所述描述性文本中的实体标记以及与所述实体标记对应的实体位置信息
。6.
根据权利要求1至5任一项所述的方法，其特征在于，所述根据所述实体标记
、
与所述实体标记对应的所述实体位置信息
、
所述目标图像，生成与所述描述性文本对应的图像，包括：将所述目标图像输入主题扩散模型的图像编码器中，获取图像编码器输出的第一嵌入信息和第二嵌入信息，所述第二嵌入信息相较于所...

【专利技术属性】
技术研发人员：马建，王瑞琛，陈宸，鲁浩楠，
申请(专利权)人：OPPO，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人