System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 目标图像生成方法和装置、图像合成模型训练方法和装置制造方法及图纸_技高网

目标图像生成方法和装置、图像合成模型训练方法和装置制造方法及图纸

技术编号:39963919 阅读:6 留言:0更新日期:2024-01-09 00:15
本公开提供了一种目标图像生成方法和装置、图像合成模型训练方法和装置,涉及人工智能技术领域,具体为自然语言处理、计算机视觉、深度学习等技术领域。目标图像生成方法的具体实现方案为:获取原始图像和背景文本,原始图像包括主体;基于原始图像,得到内缩主体图;基于原始图像,得到对应内缩主体图的内缩边缘扩散参数;基于内缩主体图、内缩边缘扩散参数、背景文本以及图像合成模型,生成合成图像,图像合成模型用于表征内缩主体图、内缩边缘扩散参数、背景文本三者与合成图像之间的关系;基于原始图像和合成图像,得到目标图像。该实施方式提高了目标图像的生成效果。

【技术实现步骤摘要】

本公开涉及人工智能,具体涉及自然语言处理、计算机视觉、深度学习等,尤其涉及一种目标图像生成方法和装置、图像合成模型训练方法和装置、电子设备、计算机可读介质以及计算机程序产品。


技术介绍

1、扩散生成模型的出现使得图像自由更换背景成为可能,通过使用扩散模型,可以通过使用文本描述自由修改图像背景,极大简化了换背景的难度,扩展了背景生成的丰富性,但目前使用扩散模型进行背景替换时,经常会出现对主体自身边缘部分进行随意外扩补充(给人手变长、衣服扩展等),导致图像中的主体遭到改变,同时原图边缘的一些像素出现在生成图中,生成图真实性和美观性下降,最终无法生成精美真实合成图像。


技术实现思路

1、提供了一种目标图像生成方法和装置、图像合成模型训练方法和装置、电子设备、计算机可读存储介质以及计算机程序产品。

2、根据第一方面,提供了一种目标图像生成方法,该方法包括:获取原始图像和背景文本,原始图像包括主体;基于原始图像,得到内缩主体图;基于原始图像,得到对应内缩主体图的内缩边缘扩散参数;基于内缩主体图、内缩边缘扩散参数、背景文本以及图像合成模型,生成合成图像,图像合成模型用于表征内缩主体图、内缩边缘扩散参数、背景文本三者与合成图像之间的关系;基于原始图像和合成图像,得到目标图像。

3、根据第二方面,提供了一种图像合成模型训练方法,方法还包括:获取预置的样本集,其中,样本集包括至少一个样本,样本包括:样本图像、样本图像中主体的区域信息以及对应样本图像的样本文本;获取预先建立的图像合成网络,其中,图像合成网络用于表征图像、图像中主体的区域信息、图像对应的文本三者与合成噪声之间的对应关系,合成噪声用于生成合成图像;执行以下训练步骤:从样本集中选取样本;将该样本输入图像合成网络,得到图像合成网络输出的合成噪声;响应于图像合成网络满足训练完成条件,得到图像合成模型。

4、根据第三方面,提供了一种目标图像生成装置,该装置包括:信息获取单元,被配置成获取原始图像和背景文本,原始图像包括主体;图像得到单元,被配置成基于原始图像,得到内缩主体图;参数得到单元,被配置成基于原始图像,得到对应内缩主体图的内缩边缘扩散参数;生成单元,被配置成基于内缩主体图、内缩边缘扩散参数、背景文本以及图像合成模型,生成合成图像,图像合成模型用于表征内缩主体图、内缩边缘扩散参数、背景文本三者与合成图像之间的关系;目标得到单元,被配置成基于原始图像和合成图像,得到目标图像。

5、根据第四方面,提供了一种图像合成模型训练装置,该装置包括:样本获取单元,被配置成获取预置的样本集,其中,样本集包括至少一个样本,样本包括:样本图像、样本图像中主体的区域信息以及对应样本图像的样本文本;网络获取单元,被配置成获取预先建立的图像合成网络,其中,图像合成网络用于表征图像、图像中主体的区域信息、图像对应的文本三者与合成噪声之间的对应关系,合成噪声用于生成合成图像;选取单元,被配置成从样本集中选取样本;输入单元,被配置成将该样本输入图像合成网络,得到图像合成网络输出的合成噪声;模型得到单元,被配置成响应于图像合成网络满足训练完成条件,得到图像合成模型。

6、根据第五方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或第二方面任一实现方式描述的方法。

7、根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面或第二方面任一实现方式描述的方法。

8、根据第七方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如第一方面或第二方面任一实现方式描述的方法。

9、本公开的实施例提供的目标图像生成方法和装置,首先,获取原始图像和背景文本,原始图像包括主体;其次,基于原始图像,得到内缩主体图;再次,基于原始图像,得到对应内缩主体图的内缩边缘扩散参数;从次,基于内缩主体图、内缩边缘扩散参数、背景文本以及图像合成模型,生成合成图像,图像合成模型用于表征内缩主体图、内缩边缘扩散参数、背景文本三者与合成图像之间的关系;最后,基于原始图像和合成图像,得到目标图像。由此,可以基于图像合成模型的图像更换背景场景,在生成丰富背景的同时,通过内缩边缘扩散参数限制了主体不合理扩展,通过原始图像补充合成图像,解决了由图像合成模型下采样导致的边缘异常问题,提高了目标图像的生成效果。

10、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种目标图像生成方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述基于所述原始图像,得到内缩主体图包括:

3.根据权利要求1所述的方法,其中,所述基于所述原始图像,得到对应所述内缩主体图的内缩边缘扩散参数包括:

4.根据权利要求1所述的方法,其中,所述基于所述原始图像,得到对应所述内缩主体图的内缩边缘扩散参数包括:

5.根据权利要求1所述的方法,其中,所述图像合成模型包括:扩散模型和控制所述扩散模型的控制模型,所述基于所述内缩主体图、所述内缩边缘扩散参数、所述背景文本以及图像合成模型,生成合成图像包括:

6.根据权利要求1-5之一所述的方法,其中,所述基于所述原始图像和所述合成图像,得到目标图像包括:

7.根据权利要求6所述的方法,其中,所述基于所述主体区域图和所述合成图像,得到目标图像包括:

8.根据权利要求6所述的方法,其中,所述基于所述原始图像,得到所述主体的主体区域图包括:

9.根据权利要求1-5之一所述的方法,其中,所述基于所述原始图像和所述合成图像,得到目标图像包括:

10.一种图像合成模型训练方法,所述方法包括:

11.一种目标图像生成装置,所述装置包括:

12.根据权利要求11所述的装置,其中,所述图像得到单元进一步被配置成:基于所述原始图像,得到所述主体的主体掩膜图像;对所述主体掩膜图像进行内缩操作,得到内缩掩膜图像;基于所述内缩掩膜图像和所述原始图像,得到内缩主体图。

13.根据权利要求11所述的装置,其中,所述参数得到单元进一步被配置成:基于所述原始图像,得到所述主体的主体掩膜图像;对所述主体掩膜图像进行内缩操作,得到内缩掩膜图像;将所述内缩掩膜图像作为内缩边缘扩散参数。

14.根据权利要求11所述的装置,其中,所述参数得到单元进一步被配置成:基于所述原始图像,得到所述主体的主体区域图;对所述主体区域图进行内缩操作,得到主体内缩图;提取所述主体内缩图的轮廓线,并将所述轮廓线作为内缩边缘扩散参数。

15.根据权利要求11所述的装置,其中,所述图像合成模型包括:扩散模型和控制所述扩散模型的控制模型,所述生成单元进一步被配置成:将所述内缩边缘扩散参数输入所述控制模型,以通过所述控制模型控制所述扩散模型中图像的扩散条件;将所述内缩主体图、所述背景文本输入所述扩散模型,得到所述扩散模型输出的合成图像。

16.根据权利要求11-15之一所述的装置,其中,所述目标得到单元进一步被配置成:基于所述原始图像,得到所述主体的主体区域图;基于所述主体区域图和所述合成图像,得到目标图像。

17.根据权利要求16所述的装置,其中,所述目标得到单元进一步被配置成:对所述主体区域图进行边缘透明化处理,得到第一处理图像;将所述第一处理图像贴入到所述合成图像,得到目标图像。

18.根据权利要求16所述的装置,其中,所述目标得到单元进一步被配置成:基于所述原始图像,得到所述主体的主体掩膜图像;基于所述主体掩膜图像和所述原始图像,得到所述主体的主体区域图。

19.根据权利要求11-15之一所述的装置,其中,所述目标得到单元进一步被配置成:基于所述原始图像,得到所述主体的主体掩膜图像;对所述主体掩膜图像进行内缩操作,得到内缩掩膜图像;基于所述主体掩膜图像和所述内缩掩膜图像,得到内缩区域图像;基于所述内缩区域图像,对所述主体掩膜图像进行边缘透明化处理,得到边缘掩膜图像;基于所述边缘掩膜图像和所述原始图像,得到第二处理图像;将所述第二处理图像贴入到所述合成图像,得到目标图像。

20.一种图像合成模型训练装置,所述装置包括:

21.一种电子设备,其特征在于,包括:

22.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。

23.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现权利要求1-10中任一项所述的方法。

...

【技术特征摘要】

1.一种目标图像生成方法,所述方法包括:

2.根据权利要求1所述的方法,其中,所述基于所述原始图像,得到内缩主体图包括:

3.根据权利要求1所述的方法,其中,所述基于所述原始图像,得到对应所述内缩主体图的内缩边缘扩散参数包括:

4.根据权利要求1所述的方法,其中,所述基于所述原始图像,得到对应所述内缩主体图的内缩边缘扩散参数包括:

5.根据权利要求1所述的方法,其中,所述图像合成模型包括:扩散模型和控制所述扩散模型的控制模型,所述基于所述内缩主体图、所述内缩边缘扩散参数、所述背景文本以及图像合成模型,生成合成图像包括:

6.根据权利要求1-5之一所述的方法,其中,所述基于所述原始图像和所述合成图像,得到目标图像包括:

7.根据权利要求6所述的方法,其中,所述基于所述主体区域图和所述合成图像,得到目标图像包括:

8.根据权利要求6所述的方法,其中,所述基于所述原始图像,得到所述主体的主体区域图包括:

9.根据权利要求1-5之一所述的方法,其中,所述基于所述原始图像和所述合成图像,得到目标图像包括:

10.一种图像合成模型训练方法,所述方法包括:

11.一种目标图像生成装置,所述装置包括:

12.根据权利要求11所述的装置,其中,所述图像得到单元进一步被配置成:基于所述原始图像,得到所述主体的主体掩膜图像;对所述主体掩膜图像进行内缩操作,得到内缩掩膜图像;基于所述内缩掩膜图像和所述原始图像,得到内缩主体图。

13.根据权利要求11所述的装置,其中,所述参数得到单元进一步被配置成:基于所述原始图像,得到所述主体的主体掩膜图像;对所述主体掩膜图像进行内缩操作,得到内缩掩膜图像;将所述内缩掩膜图像作为内缩边缘扩散参数。

14.根据权利要求11所述的装置,其中,所述参数得到单元进一步被配置成:基于所述原始图像,得到所述主体的主体区域图;对所述主体区域图进行内缩操作,得到主体内缩图;提取所述主体...

【专利技术属性】
技术研发人员:曹超
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1