基于空间布局的交互式图像生成方法、系统及其使用方法技术方案

技术编号：40579605 阅读：8 留言：0更新日期：2024-03-06 17:22

本发明专利技术公开了基于空间布局的交互式图像生成方法、系统及其使用方法，包括：导入目标图像和参考图像；其中，目标图像为：用户想要进行生成任务的原本的图像，参考图像为：用来为目标图片提供特征属性的图像；将参考图像的特征属性转移到目标图像，并通过控制目标图像和参考图像之间的距离，来调整参考图像的特征属性对目标图像的影响权重；基于调整后的目标图像和参考图像，生成新的目标图像。本发明专利技术可以轻松调整图像位置来控制生成的结果，增强直观的交互和效率。这种方法使用户能够更好地控制结果，提高他们的创作自由度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图片生成，尤其涉及基于空间布局的交互式图像生成方法、系统及其使用方法。

技术介绍

1、尽管生成对抗网络（gan）的能力令人印象深刻，但控制其生成图像的风格和内容仍然是一个挑战。对 gan 生成的图像风格和内容进行主动控制对于满足实际应用中的特定要求至关重要。这导致了 gan 图像生成工具的出现，使用户能够表达他们的创造力和想法。此外，个性化生成已获得认可，产生了各种旨在满足用户愿望的工具。

2、然而，现有工具仍然缺乏控制灵活性和用户友好性。例如，基于草图的工具通常要求用户具备特定的绘图技能或图像编辑经验。此外，生成的图像通常无法达到所需的真实感水平。基于滑块的工具提供的选择有限，忽略了多样化的用户需求和创意表达。基于文本的工具依赖于抽象输入，导致用户的期望与获得的结果之间存在差距。此外，一些工具还存在界面混乱、操作复杂等直观效率问题。随着用户对生成工具越来越追求自由度和个性化，传统的工具模式已经不足以满足特定场景的需求。

技术实现思路

1、本专利技术的目的在于推出一种专为灵活图像生成而设计的新颖工具，它的主要目标是提供一个超越传统控制功能的多功能图像生成平台，通过创新的2d布局设计，用户可以轻松调整图像位置来控制生成的结果，增强直观的交互和效率，这种方法使用户能够更好地控制结果，提高他们的创作自由度，此外，该工具集成了现实世界的图像作为参考，使用户能够使用现有图像的属性来指导目标图像的生成，这不仅有助于结果预期，而且还能激发创造性探索和实验，从而促进更牢固的用户与内容联系。

2、为实现上述目的，本专利技术提供了基于空间布局的交互式图像生成方法，包括：

3、导入目标图像和参考图像；其中，所述目标图像为：用户想要进行生成任务的原本的图像，所述参考图像为：用来为目标图片提供特征属性的图像；

4、将所述参考图像的特征属性转移到所述目标图像，并通过控制所述目标图像和参考图像之间的距离，调整所述参考图像的特征属性对所述目标图像的影响权重；

5、根据最终的权重生成新的目标图像。

6、可选地，所述参考图像的特征属性包括：局部属性和全局属性；

7、所述局部属性包括：眼睛、鼻子、嘴巴和头发；

8、所述全局属性包括：妆容、年龄、脸型和头的朝向。

9、可选地，将所述参考图像的局部属性转移到所述目标图像包括：

10、采用掩码预处理方法，为每个所述参考图像提供相应的掩码；从所述参考图像中选择一个所述局部属性时，同时识别出所选择的所述局部属性对应的掩码；将识别出的掩码与所述参考图像相结合以提取所述局部属性的区域；

11、将提取的区域添加到所述目标图像以创建新的输入图像；使用预训练的编码器来处理所述输入图像和目标图像，并产生两个相应的潜在向量 code t和 codei；

12、利用加权加法，将潜在向量 code t和 codei输入到预训练的图像生成器中，产生所述局部属性的传输结果。

13、可选地，将所述参考图像的全局属性转移到所述目标图像包括：

14、从预先收集的人像数据集中选择与参考图像对齐的基础图像；其中，所述基础图像为：经过对齐后的基础图像，所述基础图像与所述参考图像仅存在一个属性区别，所述基础图像用于提取参考图像的全局特征；

15、将所述基础图像、目标图像和参考图像输入到预训练的编码器中，获取潜在向量code t、code r和code b；

16、先通过从code r中减去code b，提取与所述全局属性相关的属性的表示，再将code t添加到code r中以产生新的潜在参数；

17、将新的潜在参数输入预训练的图像生成器来生成单个全局属性的传输图像。

18、可选地，通过控制所述目标图像和参考图像之间的距离，来调整所述参考图像的特征属性对所述目标图像的影响权重的方法包括：

19、

20、其中，为距离权重， k为常数， tar为目标图像的（x,y）坐标， refi为第i个参考图像的（x,y）坐标，为最后生成的图片结果， g为生成器， n为参考图像的个数， code i为第i个参考图像的潜在向量。

21、为实现上述目的，本专利技术还提供了基于空间布局的交互式图像生成系统，包括：导入模块、调整模块和生成模块；

22、所述导入模块，用于导入目标图像和参考图像；其中，所述目标图像为：用户想要进行生成任务的原本的图像，所述参考图像为：用来为目标图片提供特征属性的图像；

23、所述调整模块，用于将所述参考图像的特征属性转移到所述目标图像，并通过控制所述目标图像和参考图像之间的距离，来调整所述参考图像的特征属性对所述目标图像的影响权重；

24、所述生成模块，用于基于调整后的所述目标图像和参考图像，生成新的目标图像。

25、可选地，所述参考图像的特征属性包括：局部属性和全局属性；

26、所述局部属性包括：眼睛、鼻子、嘴巴和头发；

27、所述全局属性包括：妆容、年龄、脸型和头的朝向。

28、为实现上述目的，本专利技术还提供了基于空间布局的交互式图像生成系统的使用方法，包括：

29、导入目标图片和参考图片；

30、选择所述参考图片的特征属性，通过调节所述目标图片和参考图片间的距离来控制生成效果。

31、本专利技术具有以下有益效果：

32、本专利技术先导入目标图像和参考图像；再将参考图像的特征属性转移到目标图像，并通过控制目标图像和参考图像之间的距离，来调整参考图像的特征属性对目标图像的影响权重；通过本专利技术用户可以轻松调整图像位置来控制生成的结果，增强直观的交互和效率。这种方法使用户能够更好地控制结果，提高他们的创作自由度。此外，该工具集成了现实世界的图像作为参考，使用户能够使用现有图像的属性来指导目标图像的生成。这不仅有助于结果预期，而且还能激发创造性探索和实验，从而促进更牢固的用户与内容联系。

本文档来自技高网...

【技术保护点】

1.基于空间布局的交互式图像生成方法，其特征在于，包括：

2.根据权利要求1所述的基于空间布局的交互式图像生成方法，其特征在于，所述参考图像的特征属性包括：局部属性和全局属性；

3.根据权利要求2所述的基于空间布局的交互式图像生成方法，其特征在于，将所述参考图像的局部属性转移到所述目标图像包括：

4.根据权利要求2所述的基于空间布局的交互式图像生成方法，其特征在于，将所述参考图像的全局属性转移到所述目标图像包括：

5.基于空间布局的交互式图像生成系统，其特征在于，用于实施权利要求1-4任一项所述的基于空间布局的交互式图像生成方法，所述系统包括：导入模块、调整模块和生成模块；

6.根据权利要求5所述的基于空间布局的交互式图像生成系统，其特征在于，所述参考图像的特征属性包括：局部属性和全局属性；

7.基于空间布局的交互式图像生成系统的使用方法，其特征在于，应用如权利要求5-6任一项所述的基于空间布局的交互式图像生成系统，所述使用方法包括：

【技术特征摘要】

1.基于空间布局的交互式图像生成方法，其特征在于，包括：

2.根据权利要求1所述的基于空间布局的交互式图像生成方法，其特征在于，所述参考图像的特征属性包括：局部属性和全局属性；

3.根据权利要求2所述的基于空间布局的交互式图像生成方法，其特征在于，将所述参考图像的局部属性转移到所述目标图像包括：

4.根据权利要求2所述的基于空间布局的交互式图像生成方法，其特征在于，将所述参考图像的全局属性转移到所述目标图像包括：

...

【专利技术属性】
技术研发人员：魏家富，杨溪，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人