奥多比公司专利技术

奥多比公司共有512项专利

  • 本公开的实施例涉及经代理指导的图像编辑。一种用于图像处理的方法、装置、非暂时性计算机可读介质和系统包括获取输入图像和输入掩码,其中输入掩码指示输入图像中待被修改的区域;以及使用第一图像生成模型,基于输入图像和输入掩码,生成中间结果,其中...
  • 本公开的实施例涉及使用多域扩散神经网络生成视觉感知设计布局。本公开涉及经由多域扩散根据图像元素生成针对数字设计的布局的系统、方法和非暂时性计算机可读介质。例如,在一些实施例中,所公开的系统从客户端设备接收用于生成数字设计的多个图像元素。...
  • 本公开的实施例涉及利用局部化约束的文本到图像生成神经网络生成合成数字图像。公开了用于经由具有局部化约束的生成式神经网络生成数字图像的方法、系统和非暂态计算机可读存储介质。所公开的系统利用一个或多个编码器神经网络生成嵌入序列,该嵌入序列包...
  • 本公开的实施例涉及使用动态放大以子像素精度对数字图像进行矢量化。本公开涉及选择性地利用图像超分辨率模型放大与高频部分相对应的图像块的系统、方法和非暂时性计算机可读介质。特别地,所公开的系统选择与第一分辨率的数字图像的高频部分相对应的图像...
  • 本公开的实施例涉及使用机器学习进行图像重光照。一种用于图像生成的方法、装置、非暂态计算机可读介质和系统包括:获取输入图像和输入提示,其中输入图像描绘对象并且输入提示描述针对对象的光照条件;基于输入图像和输入提示,生成经重光照的图像特征,...
  • 本公开实施例涉及使用扩散模型的参考图像结构匹配。一种用于图像处理的方法、装置、非暂态计算机可读介质和系统,包括:获取指示目标空间结构的结构输入;使用条件编码器对结构输入进行编码以获取表示目标空间结构的结构编码;以及使用图像生成模型基于结...
  • 本公开的实施例涉及实时的基于文本解纠缠的真实图像编辑。一种用于图像处理的方法、装置、非暂时性计算机可读介质和系统包括:获取描绘第一元素的输入图像、输入图像的文本描述以及描述第二元素的修改提示,第二元素与第一元素不同;基于输入图像和文本描...
  • 本公开的实施例涉及多模态相似性搜索的统一框架。本文公开了一种用于增强型相似性搜索的技术。在实现中,搜索环境包括一个或多个计算硬件、软件和/或固件组件以支持增强型相似性搜索。一个或多个组件标识相对于查询对象的相似性搜索的模态。组件基于模态...
  • 本公开的实施例涉及无掩模合成图像生成。一种方法、装置、非暂态计算机可读介质和系统包括获取描绘背景场景的第一图像和描绘前景元素的第二图像,基于第二图像生成引导嵌入,以及基于第一图像和引导嵌入生成描绘前景元素和背景场景的合成图像,其中图像生...
  • 一种用于图像处理的方法、装置、非暂态计算机可读介质和系统,包括获得描述元件的文本提示和元件的连续属性的属性值;嵌入文本提示以获得文本嵌入空间中的文本嵌入;嵌入属性值以获得文本嵌入空间中的属性嵌入;以及基于文本嵌入和属性嵌入生成合成图像,...
  • 本公开的实施例涉及使用神经网络动态估计增强现实场景中位置的照明参数。本公开涉及使用局部照明估计神经网络来估计用于增强现实的数字场景内特定位置的照明参数的方法、非瞬态计算机可读介质和系统。例如,基于在数字场景中绘制虚拟对象的请求,系统使用...
  • 本公开的实施例涉及数字对象的结构感知交错。本公开涉及用于根据结构图节点的视觉次序来生成交错式数字设计的系统、非暂时性计算机可读介质和方法。特别地,在一个或多个实施例中,所公开的系统由至少一个处理器生成数字设计的结构图,该结构图将数字设计...
  • 本公开的实施例涉及使用控制网络进行草图到图像生成。用于图像生成的方法、装置、非暂时性计算机可读介质和系统包括获取草图输入和保真度参数的值,保真度参数的值指示对草图输入的依从水平。草图输入和保真度参数的值被编码,以获取草图指导信息。然后,...
  • 本公开的实施例涉及从自然语言请求生成三维数字内容。公开了用于基于自然语言短语生成三维场景的方法、系统和非瞬态计算机可读存储介质。例如,所公开的系统可以对自然语言短语进行分析以确定涉及自然语言短语中的实体和命令的依赖性。然后,所公开的系统...
  • 本公开的实施例涉及使用神经网络的交互式图像抠图。公开了基于深度神经网络(DNN)的交互式图像抠图的技术。实现根据实施例技术的方法包括:由DNN基于图像中用户指定的前景区域位置,生成与图像相关联的阿尔法蒙板。方法还包括将第一DNN子网应用...
  • 本公开的实施例涉及利用对象属性检测模型来自动地选择图像中所检测的对象的实例。本公开还涉及一种对象选择系统,该对象选择系统精确地检测并自动选择数字图像中的用户请求的对象的目标实例(例如查询对象实例)。在一个或多个实施例中,对象选择系统可以...
  • 本公开的实施例涉及利用临界边缘检测神经网络和几何模型确定相机参数。用于确定针对数字图像的相机参数的方法包括标识经由具有相机参数的相机设备而被拍摄的数字图像;通过检测数字图像内的边缘生成边缘图;通过基于边缘是否对应于数字图像的一条或多条消...
  • 本公开的实施例涉及用于文本到图像合成的多属性转换。一种图像生成模型获得文本提示、第一属性词元以及第二属性词元。针对第一属性词元而标识图像生成模型的第一层集合和第一时间步集合,针对第二属性词元而标识图像生成模型的第二层集合和第二时间步集合...
  • 本公开的实施例涉及定制视频生成中的动作和外观。系统和方法包括基于定制动作生成合成的视频。视频生成系统获得包括对象和定制动作词元的文本提示。定制动作词元表示定制动作。系统将文本提示编码以获得文本嵌入。随后,视频生成模型使用视频生成模型,基...
  • 本公开的实施例涉及用于引导生成模型的背景分离。本公开的实施例包括获取输入图像和近似掩模,近似掩模近似地指示输入图像的前景区域。一些实施例基于输入图像,生成前景区域的无条件掩模。前景区域的有条件掩模基于输入图像和近似掩模而被生成。然后,输...