奥多比公司专利技术

奥多比公司共有512项专利

  • 本公开的实施例涉及使用基于知识图谱的内容适配的演示生成。一种用于生成演示的方法、装置、非暂态计算机可读介质和系统包括获取描述主题的输入提示,并且使用文本生成模型基于输入提示生成演示大纲。然后基于演示大纲生成演示结构,其中演示结构包括指示...
  • 本公开的实施例涉及零样本内容定制和组成。一种用于图像生成的方法、装置、非暂态计算机可读介质和系统包括获得对象提示和背景提示,其中该对象提示描述具有目标效果的对象并且该背景提示描述场景。噪声输入基于对象提示和背景提示而被生成,其中该噪声输...
  • 本公开的实施例涉及使用文本引导的一键式动态故事板。一种用于图像处理的方法、装置、非瞬态计算机可读介质和系统,包括:获取描述故事的文本提示;基于文本提示生成第一场景提示和第二场景提示,其中第一场景提示描述故事的第一场景并且第二场景提示描述...
  • 本公开的实施例涉及利用图像生成模型编辑图像。用于图像处理的方法、装置、非暂态计算机可读介质和系统,包括:获得输入图像和修改提示词,其中输入图像描绘具有第一属性的对象,并且修改提示词描述从第一属性到不同于第一属性的第二属性的修改;对修改提...
  • 本公开实施例涉及将向量对象吸附到用于对象移动和旋转的参考轨迹。公开了用于根据数字图像中的参考路径修改数字图像中的对象的方法、系统和非暂态计算机可读存储介质。所公开的系统关于向量图像中的对象来确定向量图像的路径的几何参数和从对象到路径的距...
  • 本公开的实施例涉及样式应用引擎。用于图像生成的方法、装置、非瞬态计算机可读介质、以及系统包括获得图像和样式指南,其中图像描绘了具有第一颜色的对象,并且样式指南包括第二颜色。基于接近度标准,从样式指南选择第二颜色。基于图像和第二颜色来生成...
  • 本公开的实施例涉及利用扩散模型进行的二维矢量图形的三维旋转,提供了用于矢量图形的三维旋转的系统、非暂态计算机可读介质和方法。具体地,在一些实施例中,所公开的系统提供第一取向上的二维矢量图形以用于经由客户端设备的图形用户界面进行显示。此外...
  • 各种公开的实施例涉及视觉内容的自动动画。具体地,一些实施例首先接收设计文档。然后,一些实施例生成设计文档的渲染图像。然后,一些实施例生成指示图像中的一个或多个视觉重要性区域的掩模。一些实施例进一步从设计文档生成场景图。一些实施例至少部分...
  • 本申请涉及用于基于掩码的视频蒙版的循环引导。本申请公开了用于被训练为使用先前视频帧的循环引导来生成视频序列的阿尔法蒙版帧的数字设计系统的实施例。该方法可以包括接收视频序列以及用于视频序列的第一视频帧的输入掩码视频帧。所公开的系统和方法还...
  • 本公开实施例涉及使用神经网络的翻译内容上的文本样式转换。本公开涉及用于使用神经网络在经翻译的文本上转换样式格式化的系统、非暂态计算机可读介质和方法。具体地,在一些实施例中,所公开的系统获取输入文本串,该输入文本串包括样式格式化元素。此外...
  • 本公开涉及利用锚标记集合对噪声标记进行去噪,从而基于去噪标记来生成数字视频的系统、方法、和非暂态计算机可读介质。具体地,所公开的系统从作为图像到视频请求的一部分的数字图像生成图像标记集合。此外,所公开的系统通过向图像标记集合添加时间步长...
  • 本公开涉及用于使用几何图形匹配算法将曲线对齐到精确几何图形形状的系统、非暂态计算机可读介质和方法。例如,所公开的系统通过对跨越数字图像中所描绘的第一角点和第二角点之间的曲线进行采样来生成沿着数字图像中所描绘的曲线的离散点集合。所公开的系...
  • 本公开涉及利用离散分层和分类来将光栅图像分解为组成元素。本公开涉及用于将光栅设计分解为组成元素的系统、非瞬态计算机可读介质和方法。具体地,所公开的系统利用多个分割神经网络来确定与数字图像的不同深度相对应的一组层,每个层包括不重叠的设计元...
  • 本公开涉及基于生成式流水线的动态帧生成。用于图像处理的方法、装置和非瞬态计算机可读介质包括获得文档元素和输入提示,其中该输入提示描述了针对文档元素的装饰元素;基于文档元素来生成装饰遮罩,其中该装饰遮罩指示针对装饰元素的位置;基于输入提示...
  • 本公开的实施例涉及用于矢量化光栅图像的高级图像跟踪。本公开涉及用于使用高级边缘检测算法来检测和跟踪光栅图像中的边缘的系统、非瞬态计算机可读介质、以及方法。例如,针对光栅图像中的滑动像素窗口,所公开的系统根据位于滑动像素窗口内的像素值来生...
  • 本公开的实施例涉及基于实体标注的提示增强。用于媒体处理的方法、装置、非暂时性计算机可读介质、以及系统包括接收包括实体短语的文本提示、在文本提示内标记实体短语以获得修订后的提示、通过基于来自修订后的提示的词元序列执行自回归词元生成来生成替...
  • 本申请的各实施例涉及利用动态记忆网络来跟踪数字对话状态并生成响应。本公开涉及基于由具有动态记忆网络架构的神经网络生成的数字对话状态来生成数字响应。例如,在一个或多个实施例中,所公开的系统将具有一个或多个段的数字对话提供到具有包括一组多个...
  • 本公开的实施例涉及对隐式定义的数字3D形状的直接操纵。公开了用于直接操纵隐式定义的数字三维(3D)形状的技术。在示例方法中,计算设备基于包括一个或多个参数的隐式定义来渲染3D形状。该计算设备接收输入的指示,其指示对一点处的3D形状的修改...
  • 本公开的实施例涉及针对用户追踪输入来生成图像中的候选路径的辅助指南。本公开涉及针对光栅图像的路径追踪来提供辅助指南的系统、方法和非暂态计算机可读介质。具体地,在一个或多个实现中,所公开的系统确定与光栅图像内的片段集合的边界相对应的外框集...
  • 本公开涉及使用从自然语言文本输入生成的可执行代码执行文本到图像编辑的系统、方法和非瞬态计算机可读介质。例如,在一个或多个实施例中,所公开的系统从客户端设备接收数字图像和提供用于修改数字图像的指令的自然语言文本输入。所公开的系统还使用大语...
1 2 3 4 5 6 7 8 尾页