一种图像生成方法、装置、设备及存储介质制造方法及图纸

技术编号:33922829 阅读:19 留言:0更新日期:2022-06-25 21:17
本发明专利技术公开了一种图像生成方法、装置、设备及存储介质,该方法包括:响应于检测到目标图像布局数据,将目标图像布局数据输入到预先训练完成的目标图像标记模型中;通过目标图像标记模型中的特征转换模块,基于目标图像布局数据,输出对象特征向量;通过目标图像标记模型中的图像标记模块,获取待生成图像中多个图像块分别对应的图像块坐标数据,基于各图像块坐标数据和各边界坐标数据,构建连接矩阵,并基于连接矩阵和对象特征向量,输出多个图像块分别对应的目标图像块标识;将各目标图像块标识输入到预先训练完成的图像生成模型中,得到输出的待生成图像。本实施例解决了现有技术中连接矩阵构建不合理的问题,提高了生成图像的质量。质量。质量。

【技术实现步骤摘要】
一种图像生成方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种图像生成方法、装置、设备及存储介质。

技术介绍

[0002]图像生成器一直是机器视觉的一个关注的焦点,在海报设计、虚拟场景设计等均发挥重要作用。
[0003]现有的图像生成器主要分别两种,一种是采用基于卷积神经网络模型的图像生成方法,另一种是基于transformer模型的图像生成方法。
[0004]在实现本专利技术的过程中,发现现有技术中至少存在以下技术问题:
[0005]基于卷积神经网络模型的图像生成方法无法生成正确的物体结构,如生成一个具有三只手的人的图像。而基于transformer模型的图像生成方法中连接矩阵的构建方式不合理,无法准确理解图像中多个对象之间的关系,如本应生成人骑马的图像,却生成了人站在马身上的图像。因此,现有的图像生成器生成的图像质量较差。

技术实现思路

[0006]本专利技术提供了一种图像生成方法、装置、设备及存储介质,以解决现有技术中连接矩阵的构建方式不合理的问题,提高图像生成器生成的图像质量。
[0007]根据本专利技术的一方面,提供了一种图像生成方法,该方法包括:
[0008]响应于检测到目标图像布局数据,将所述目标图像布局数据输入到预先训练完成的目标图像标记模型中;其中,所述目标图像局部数据包括待生成图像中包含的至少一个对象分别对应的边界坐标数据;
[0009]通过所述目标图像标记模型中的特征转换模块,基于所述目标图像布局数据,输出对象特征向量;
[0010]通过所述目标图像标记模型中的图像标记模块,获取所述待生成图像中多个图像块分别对应的图像块坐标数据,基于各所述图像块坐标数据和各所述边界坐标数据,构建连接矩阵,并基于所述连接矩阵和所述对象特征向量,输出多个图像块分别对应的目标图像块标识;其中,所述连接矩阵表征所述待生成图像中对象与图像块之间的交互信息和/或图像块之间的交互信息;
[0011]将各所述目标图像块标识输入到预先训练完成的图像生成模型中,得到输出的待生成图像。
[0012]根据本专利技术的另一方面,提供了一种图像生成装置,该装置包括:
[0013]目标图像布局数据输入模块,用于响应于检测到目标图像布局数据,将所述目标图像布局数据输入到预先训练完成的目标图像标记模型中;其中,所述目标图像局部数据包括待生成图像中包含的至少一个对象分别对应的边界坐标数据;
[0014]对象特征向量输出模块,用于通过所述目标图像标记模型中的特征转换模块,基
于所述目标图像布局数据,输出对象特征向量;
[0015]目标图像块标识确定模块,用于通过所述目标图像标记模型中的图像标记模块,获取所述待生成图像中多个图像块分别对应的图像块坐标数据,基于各所述图像块坐标数据和各所述边界坐标数据,构建连接矩阵,并基于所述连接矩阵和所述对象特征向量,输出多个图像块分别对应的目标图像块标识;其中,所述连接矩阵表征所述待生成图像中对象与图像块之间的交互信息和/或图像块之间的交互信息;
[0016]待生成图像输出模块,用于将各所述目标图像块标识输入到预先训练完成的图像生成模型中,得到输出的待生成图像。
[0017]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
[0018]至少一个处理器;以及
[0019]与所述至少一个处理器通信连接的存储器;其中,
[0020]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的图像生成方法。
[0021]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的图像生成方法。
[0022]本专利技术实施例的技术方案,通过预先训练完成的目标图像标记模块中的图像标记模块,获取待生成图像中多个图像块分别对应的图像块坐标数据,基于各图像块坐标数据和各边界坐标数据,构建连接矩阵,该连接矩阵表征待生成图像中对象与图像块之间的交互信息和/或图像块之间的交互信息,基于连接矩阵和基于目标图像布局数据输出的对象特征向量,输出多个图像块分别对应的目标图像块标识,解决了现有技术中构建的连接矩阵表征出的交互信息在对象级别和图像块级别存在纠缠现象的问题,提高了构建的连接矩阵的合理性,进而保证了生成的图像中对象结构的准确性以及对象之间关联关系的合理性,提高了生成图像的图像质量。
[0023]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0024]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]图1是根据本专利技术实施例提供的一种图像生成方法的流程图;
[0026]图2A是根据本专利技术实施例提供的一种图像块的示意图;
[0027]图2B是根据本专利技术实施例提供的一种连接矩阵的原理图;
[0028]图2C是现有技术构建的连接矩阵的示意图;
[0029]图2D是根据本专利技术实施例提供的一种连接矩阵的示意图;
[0030]图2E是根据本专利技术实施例提供的另一种连接矩阵的示意图;
[0031]图3是根据本专利技术实施例提供的另一种图像生成方法的流程图;
[0032]图4是根据本专利技术实施例提供的另一种连接矩阵的示意图;
[0033]图5是根据本专利技术实施例提供的另一种图像生成方法的流程图;
[0034]图6是根据本专利技术实施例提供的另一种连接矩阵的示意图;
[0035]图7是根据本专利技术实施例提供的另一种图像生成方法的流程图;
[0036]图8是根据本专利技术实施例提供的一种目标图像标记模型的训练方法的流程图;
[0037]图9是根据本专利技术实施例提供的一种图像生成装置的结构示意图;
[0038]图10是根据本专利技术实施例提供的一种电子设备的结构示意图。
具体实施方式
[0039]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0040]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法,其特征在于,包括:响应于检测到目标图像布局数据,将所述目标图像布局数据输入到预先训练完成的目标图像标记模型中;其中,所述目标图像局部数据包括待生成图像中包含的至少一个对象分别对应的边界坐标数据;通过所述目标图像标记模型中的特征转换模块,基于所述目标图像布局数据,输出对象特征向量;通过所述目标图像标记模型中的图像标记模块,获取所述待生成图像中多个图像块分别对应的图像块坐标数据,基于各所述图像块坐标数据和各所述边界坐标数据,构建连接矩阵,并基于所述连接矩阵和所述对象特征向量,输出多个图像块分别对应的目标图像块标识;其中,所述连接矩阵表征所述待生成图像中对象与图像块之间的交互信息和/或图像块之间的交互信息;将各所述目标图像块标识输入到预先训练完成的图像生成模型中,得到输出的待生成图像。2.根据权利要求1所述的方法,其特征在于,所述基于各所述图像块坐标数据和各所述边界坐标数据,构建连接矩阵,包括:针对每个边界坐标数据,将各图像块坐标数据依次作为目标图像块坐标数据;基于所述边界坐标数据和所述目标图像块坐标数据,判断所述目标图像块坐标数据对应的目标图像块是否属于所述边界坐标数据对应的对象;如果是,则将连接矩阵中所述目标图像块和所述对象共同对应的矩阵值设置为第一数值,以使所述连接矩阵表征所述待生成图像中所述目标图像块与所述对象之间的交互信息。3.根据权利要求2所述的方法,其特征在于,所述基于所述边界坐标数据和所述目标图像块坐标数据,判断所述目标图像块坐标数据对应的目标图像块是否属于所述边界坐标数据对应的对象,包括:基于所述边界坐标数据,确定所述边界坐标数据对应的对象在所述待生成图像中的对象区域;基于所述目标图像块坐标数据以及预设图像块尺寸,确定所述目标图像块坐标数据对应的目标图像块在所述待生成图像中的目标图像块区域;如果所述目标图像块区域与所述对象区域之间的重叠区域,与所述目标图像块区域之间的面积比例超过预设面积比例,则确定所述目标图像块属于所述边界坐标数据对应的对象。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:如果所述目标图像块坐标数据对应的目标图像块不属于任一边界坐标数据对应的对象,则将连接矩阵中所述目标图像块和每一对象共同对应的矩阵值均设置为第一数值,以使所述连接矩阵表征所述待生成图像中所述目标图像块与每个对象之间的交互信息。5.根据权利要求1所述的方法,其特征在于,所述基于各所述图像块坐标数据和各所述边界坐标数据,构建连接矩阵,包括:针对任意两个图像块坐标数据,基于所述任意两个图像块坐标数据和各所述边界坐标数据,判断所述任意两个图像块坐标数据分别对应的两个图像块是否属于同一边界坐标数
据对应的对象;如果是,则将连接矩阵中所述两个图像块共同对应的矩阵值设置为第一数值,以使所述连接矩阵表征所述待生成图像中所述两个图像块之间的交互信息。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:如果所述任意两个图像块坐标数据分别对应的两个图像块不属于同一边界坐标数据对应的对象,则判断所述任意两个图像块坐标数据分别对应的两个图像块是否均不属于任一边界坐标数据对应的对象;如果是,...

【专利技术属性】
技术研发人员:王超岳刘大庆詹忆冰杨祚鹏
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1