System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 使用生成式AI的目标场景合成制造技术_技高网
当前位置: 首页 > 专利查询>奥多比公司专利>正文

使用生成式AI的目标场景合成制造技术

技术编号:41061544 阅读:2 留言:0更新日期:2024-04-24 11:13
本公开的实施例涉及使用生成式AI的目标场景合成。本公开的实施例提供了使用自然语言提示来生成合成目标场景的技术。该方法包括接收要使用机器学习模型而被生成的图像的自然语言描述。方法还包括从要被生成的图像的自然语言描述提取控制元素和子提示。方法还包括基于要被生成的图像的自然语言描述,标识控制元素和子提示之间的关系。方法还包括由机器学习模型基于控制元素、子提示和关系来生成图像。图像包括与控制元素和子提示相对应的视觉元素。

【技术实现步骤摘要】

本公开的实施例涉及计算机领域,并且更具体地,涉及目标场景合成的方法、系统和介质。


技术介绍

1、数字工具允许艺术家在数字工作空间中表现创造性的努力。例如,艺术家(或其它创作者)在数字工作空间中创建场景。场景是在数字工作空间中创建的、由艺术家创造性的努力/想法产生的概念或对象和对象间关系的集合。特别地,场景包括视觉元素的合成(或结构布置)。有时,艺术家创建场景的对象中的每个对象(或其它视觉元素)。备选地,艺术家可以重新使用先前创建的对象的部分,并且使这样的对象适配新的场景。然而,不同的艺术家技能水平导致不一致的场景质量和创建场景所需的不同程度的努力、时间和资源(计算资源和人力资源两者)。此外,使先前创建的对象适配新的场景可能非常耗时。


技术实现思路

1、此处介绍的是使用自然语言提示来生成合成目标场景的技术。在其它实施例中,合成目标场景还基于源图像。合成目标场景包括根据被包括在自然语言提示中的任何期望的风格、视觉元素和/或图像操作的结构。目标场景的生成使得用户能够使用用户的创造性想法的自然语言描述来创建数字艺术。实际上,无论用户的技能如何,目标场景生成系统都表现用户的创造性想法。使用提示或自然语言指令,目标场景生成系统创建图像的合成物和/或生成图像以促进用户的创造性探索。

2、更特别地,在一个或多个实施例中,目标场景生成系统将接收到的目标场景的文本描述分解为用于图像生成的分离的子提示。这样的分解使用自然语言处理技术来执行。此外,由目标场景生成系统执行的分解从目标场景的子提示(诸如对象)解析控制语言,其中控制语言限定对视觉元素的合成的图像操作。

3、目标场景生成系统还从控制语言片段的布置和提示的语法结构中得出子提示的分组。这样的分组被转换为场景的视觉元素,以及附加的图像操作。最后,用户可以编辑所生成的场景,其中所生成的场景是由目标场景生成系统根据图像操作和子提示来确定的对所布置的视觉元素的推荐。

4、本公开的示例性实施例的附加特征和优点将在以下描述中阐述,并且部分地将从描述中明显,或者可以通过这样的示例性实施例的实践而获知。

本文档来自技高网...

【技术保护点】

1.一种方法,包括:

2.根据权利要求1所述的方法,其中所述控制元素包括限定所述图像的第一视觉元素的参数集,并且所述子提示限定所述图像的第二视觉元素。

3.根据权利要求2所述的方法,其中由所述机器学习模型基于所述控制元素、所述子提示和所述关系来生成所述图像还包括:

4.根据权利要求3所述的方法,其中执行所述操作包括:根据所述参数集来剪切所述第一视觉元素。

5.根据权利要求3所述的方法,其中布置所述图像包括:

6.根据权利要求2所述的方法,其中所述参数集基于所述控制元素并且包括以下一项或多项:高度参数、宽度参数、径向x值、径向y值、或描述。

7.根据权利要求2所述的方法,还包括:

8.根据权利要求7所述的方法,还包括:

9.根据权利要求1所述的方法,其中所述控制元素和所述子提示之间的所述关系是语法关系,所述语法关系将所述控制元素和所述子提示进行分组。

10.根据权利要求1所述的方法,还包括:

11.一种系统,包括:

12.根据权利要求11所述的系统,其中所述控制元素包括限定所述图像的第一视觉元素的参数集,并且所述子提示限定所述图像的第二视觉元素。

13.根据权利要求12所述的系统,其中由所述机器学习模型基于所述控制元素、所述子提示和所述关系来生成所述图像还包括:

14.根据权利要求11所述的系统,其中所述控制元素和所述子提示之间的所述关系是语法关系,所述语法关系将所述控制元素和所述子提示进行分组。

15.一种计算机可读介质,存储可执行指令,所述可执行指令在由处理设备执行时,使所述处理设备执行操作,所述操作包括:

16.根据权利要求15所述的计算机可读介质,其中布置所述图像包括:

17.根据权利要求15所述的计算机可读介质,存储还使所述处理设备执行操作的可执行指令,所述操作包括:

18.根据权利要求17所述的计算机可读介质,其中所述修订是尺寸修订、颜色修订、或位置修订中的至少一项。

19.根据权利要求15所述的计算机可读介质,其中解析所述图像的所述自然语言描述还包括:标识限定参数集的控制元素,所述参数集限定视觉元素,并且所述控制元素被用于使用所述生成式模型来生成另一视觉元素。

20.根据权利要求15所述的计算机可读介质,存储还使所述处理设备执行操作的可执行指令,所述操作包括:

...

【技术特征摘要】

1.一种方法,包括:

2.根据权利要求1所述的方法,其中所述控制元素包括限定所述图像的第一视觉元素的参数集,并且所述子提示限定所述图像的第二视觉元素。

3.根据权利要求2所述的方法,其中由所述机器学习模型基于所述控制元素、所述子提示和所述关系来生成所述图像还包括:

4.根据权利要求3所述的方法,其中执行所述操作包括:根据所述参数集来剪切所述第一视觉元素。

5.根据权利要求3所述的方法,其中布置所述图像包括:

6.根据权利要求2所述的方法,其中所述参数集基于所述控制元素并且包括以下一项或多项:高度参数、宽度参数、径向x值、径向y值、或描述。

7.根据权利要求2所述的方法,还包括:

8.根据权利要求7所述的方法,还包括:

9.根据权利要求1所述的方法,其中所述控制元素和所述子提示之间的所述关系是语法关系,所述语法关系将所述控制元素和所述子提示进行分组。

10.根据权利要求1所述的方法,还包括:

11.一种系统,包括:

12.根据权利要求11所述的系统,其中所述控制元素包括限定所述图像的第一视觉元素的参数集,并且所述子提示限定...

【专利技术属性】
技术研发人员:O·布拉迪克兹卡I·罗斯卡A·达拉比A·V·科斯汀A·奇库丽塔
申请(专利权)人:奥多比公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1