奥多比公司专利技术

奥多比公司共有512项专利

  • 本公开的实施例涉及文本到视觉机器学习嵌入技术。描述了按照各种方式来克服常规技术中的挑战的文本到视觉机器学习嵌入技术。这些技术包括:使用基于查询的训练数据,这可以扩展可用于训练模型的训练数据的可用性和类型。还描述了负数字图像样本的生成,所...
  • 本公开的实施例涉及使用光度网格表示的3D对象重建。公开了一种用于使用光度网格表示的3D对象重建的技术。解码器被预训练,以将从表示性的对象的2D图块所采样的点变换为3D多边形网格。对象的图像帧被馈送到编码器中,以获得初始潜在代码向量。对于...
  • 本公开的实施例涉及用于内容感知填充的内容感知采样区域的自动合成。本发明的实施例提供了用于自动合成针对诸如内容感知填充的孔洞填充算法的内容感知采样区域的系统、方法和计算机存储介质。给定源图像和孔洞(或其他要填充的目标区域),采样区域可以通...
  • 本公开的实施例涉及使用多组视频缓冲器用透明度控制来控制增强现实显示器。增强现实显示器在显示颜色帧与显示阿尔法帧之间交替以生成用于透明度控制的复合图像。显示处理器包括两组缓冲器,每一组包括颜色帧缓冲器和阿尔法帧缓冲器。一组缓冲器用以将数据...
  • 本公开的实施例涉及使用神经网络的交互式图像抠图。公开了基于深度神经网络(DNN)的交互式图像抠图的技术。实现根据实施例技术的方法包括:由DNN基于图像中用户指定的前景区域位置,生成与图像相关联的阿尔法蒙板。方法还包括将第一DNN子网应用...
  • 本公开的各实施例涉及用于视频递送的纹理的序列的生成。提供了用于从纹理图像生成视频以及用于从视频重构纹理图像的技术和系统。例如,纹理图像可以被划分成多个区块,并且区块的数目可以被排序成有序区块的序列。有序区块的序列可以被提供给视频编码器以...
  • 本公开的实施例涉及使用神经网络动态估计增强现实场景中位置的照明参数。本公开涉及使用局部照明估计神经网络来估计用于增强现实的数字场景内特定位置的照明参数的方法、非瞬态计算机可读介质和系统。例如,基于在数字场景中绘制虚拟对象的请求,系统使用...
  • 本公开的实施例涉及使用多模式界面以利于口头命令的发现。一种用于生成和呈现口头命令建议以利于能够被理解的命令的可发现性并支持用户探索可用命令的框架。与直接操纵输入相关联的目标经由多模式用户界面从用户处被接收。与目标相关的操作集合被选择,并...
  • 本公开的实施例涉及使用联合语义向量进行表示学习。本文公开了用于学习视频中的运动的技术。在一个实现中,人工神经网络从视频中提取特征。对应关系提议(CP)模块针对特征中的至少一些特征,基于给定特征与其他特征的语义相似度来执行针对视频中的对应...
  • 本公开的实施例涉及使用多个图像的图像阴影检测。当用户握住相对于对象定位的相机时,可以获得如由相机捕获的对象的第一图像和对象的第二图像。可以比较第一图像的第一强度图与从该第一强度图和第二图像的第二强度图获得的组合强度图之间的强度变化。然后...
  • 在用于数字画笔的动态纹理的实现中,一个或多个计算设备实现数字画笔模块以从输入设备接收笔划的笔划特性。数字画笔模块确定要应用于表示数字画笔的属性的纹理图像通道的权重。权重的幅度定义了该属性相对于数字画笔的另一个属性的重要性,该数字画笔的另...
  • 本公开涉及用于利用临界边缘检测神经网络和几何模型以从单个数字图像确定相机参数的系统、非暂态计算机可读介质以及方法。具体地,在一个或多个实施例中,所公开的系统可以训练和利用临界边缘检测神经网络,以从数字图像生成指示消失线的消失边缘图。然后...
  • 本公开的实施例涉及非语音字母语言的话音辅助应用原型测试的话音命令匹配。描述了在对具有非语音字母的语言的话音辅助应用原型的测试期间的话音命令匹配。在应用原型的测试阶段期间,显示应用原型的视觉页面。讲话到文本服务将在应用原型的测试阶段期间由...
  • 本公开的实施例涉及使用尺度多样化的分割神经网络标识目标对象。本公开涉及用于训练和利用尺度多样化的分割神经网络来分析不同尺度的数字图像并且标识数字图像中所描绘的不同目标对象的系统、非瞬态计算机可读介质和方法。例如,在一个或多个实施例中,所...
  • 本发明的实施例涉及三维模型的直观编辑。在实施例中,标识与定义对象的三维模型相关联的显著几何特征。此后,标识与显著几何特征相关联的特征属性。基于所确定的特征属性(例如性质、关系、距离)生成包括彼此相关的多个显著几何特征的特征集合。然后可以...
  • 本公开的实施例涉及边界感知对象移除和内容填充。公开了用于从图像中移除对象的系统和方法。图像处理应用标识图像中的对象集中的每个对象的边界。在一些情况下,标识使用深度学习。图像处理应用通过将对象提供给经训练的模型来标识针对该对象集中的每个对...
  • 本公开的实施例涉及从自然语言请求生成三维数字内容。公开了用于基于自然语言短语生成三维场景的方法、系统和非瞬态计算机可读存储介质。例如,所公开的系统可以对自然语言短语进行分析以确定涉及自然语言短语中的实体和命令的依赖性。然后,所公开的系统...
  • 本公开的实施例涉及用于群体肖像中的人的混合和替换的替换区域的智能标识。本公开涉及智能地混合和匹配面部和/或人以生成减少或最小化伪影和其他缺陷的增强图像。例如,所公开的系统可以选择性地应用不同的对准模型来确定参考图像与具有人的改善实例的目...
  • 在图像中的对象检测的实现中,使用异构训练数据集合来训练对象检测器。第一训练数据集合用于训练图像标记网络以确定目标概念的输入图像的注意力图。第二训练数据集合用于训练条件检测网络,该条件检测网络接受目标概念的注意力图和词嵌入作为条件输入。尽...
  • 本公开的实施例涉及基于用户指定分段执行查询时归因建模。本公开涉及使用用户指定归因模型使用从数据库取回的接触点数据的用户指定分段来实时地执行归因建模。例如,在一个或多个实施例中,一种系统将原始接触点数据存储在包括聚合器和多个节点的数据库中...