【技术实现步骤摘要】
利用场景图分析图像的方法和系统
本专利技术总体上涉及计算系统,并且更具体地涉及用于分析图像和/或执行计算机视觉任务的各种实施例。
技术介绍
通常,“计算机视觉”是指使用计算机(或计算设备、系统等)获取对图像(例如,数字图像)(包括静止/静态图像和视频(或视频帧)两者)的理解(例如,分析、处理、获取等)。相对而言,“计算机图形学”通常是指使用计算机来创建图像和/或视频(例如,场景渲染)。因此,从某种意义上讲,计算机图形学是计算机视觉的一种倒置(或相反)。利用深度学习(和/或机器学习、认知分析等)的最新趋势已经导致尝试利用计算机图形技术来改善计算机视觉任务。例如,由于计算机图形学是计算机视觉的一种倒置,因此一些尝试已经利用自动编码器来迫使学习图像中的对象的解耦表示。特别地,代替遵循经典的编码器解码器方案来学习整个图像的矢量表示,一些尝试提议在解码器之后添加图形渲染引擎以迫使网络学习对象的解耦表示。这样做可以使得系统能够以无监督的方式学习具有很多潜在应用的对象的表示,诸如人工渲染以及对象检测和/或跟踪。然而,这种方法具有局限性,因为基本的假定是对象本质上是“固体”(即,没有运动部分),诸如球、杯子、椅子等的情况。相对而言,很多“真实世界”对象具有很多独立的部分(例如,人体具有头部、身体/躯干、手臂、腿、手、脚、眼睛等),这些部分可以一起移动或独立移动,这取决于它们所连接的其他部分。这样,这种对象的适当的视觉表示要复杂得多。
技术实现思路
描述了用于通过一个或多个处理器分析图像的各种实施例 ...
【技术保护点】
1.一种由一个或多个处理器执行的用于分析图像的方法,包括:/n接收图像;/n检测出现在所述图像中的对象;/n为所述对象生成场景图;以及/n为所述对象确定至少一个变换矩阵,其中当所述对象基于所述场景图而出现在所述图像中时,所述至少一个变换矩阵与渲染所述对象相关联。/n
【技术特征摘要】
20190308 US 16/296,6921.一种由一个或多个处理器执行的用于分析图像的方法,包括:
接收图像;
检测出现在所述图像中的对象;
为所述对象生成场景图;以及
为所述对象确定至少一个变换矩阵,其中当所述对象基于所述场景图而出现在所述图像中时,所述至少一个变换矩阵与渲染所述对象相关联。
2.根据权利要求1所述的方法,还包括利用所述场景图和所述至少一个变换矩阵生成第二图像。
3.根据权利要求2所述的方法,其中所述场景图的所述生成、所述至少一个变换矩阵的所述确定和所述第二图像的所述生成利用自动编码器被执行,并且所述自动编码器包括编码器、解码器和渲染引擎,并且其中所述编码器被配置为为所述对象生成所述场景图,所述解码器被配置为基于所述场景图确定所述至少一个变换矩阵,并且所述渲染引擎被配置为基于所述场景图和所述至少一个变换矩阵生成所述第二图像。
4.根据权利要求2所述的方法,其中所述场景图的所述生成、所述至少一个变换矩阵的所述确定和所述第二图像的所述生成利用自动编码器被执行,并且所述方法还包括利用无监督学习方法训练所述自动编码器。
5.根据权利要求1所述的方法,还包括:
检测出现在所述图像中的第二对象,其中所述对象具有第一对象类型并且所述第二对象具有第二对象类型;
为所述第二对象生成第二场景图;以及
为所述第二对象确定至少一个第二变换矩阵,其中当所述第二对象基于所述第二场景图而出现在所述图像中时,所述至少一个第二变换矩阵与渲染所述第二对象相关联。
6.根据权利要求1所述的方法,还包括检测出现在所述图像中的第二对象,其中所述对象和所述第二对象具有相同的对象类型,并且其中当所述第二对象基于所述场景图而出现在所述图像中时,所述至少一个变换矩阵还与渲染所述第二对象相关联。
7.根据权利要求6所述的方法,还包括:
检测出现在所述图像中的第三对象,其中所述对象和所述第二对象具有第一对象类型并且所述第三对象具有第二对象类型;
为所述第三对象生成第二场景图;以及
为所述第三对象确定至少一个第二变换矩阵,其中当所述第三对象基于所述第二场景图而出现在所述图像中时,所述至少一个第二变换矩阵与渲染所述第三对象相关联。
8.一种用于分析图像的系统,包括:
至少一个处理器,用于
接收图像;
检测出现在所述图像中的对象;
为所述对象生成场景图;以及
为所述对象确定至少一个变换矩阵,其中当所述对象基于所述场景图而出现在所述图像中时,所述至少一个变换矩阵与渲染所述对象相关联。
9.根据权利要求8所述的系统,其中所述至少一个处理器还利用所述场景图和所述至少一个变换矩阵生成第二图像。
10.根据权利要求9所述的系统,其中所述场景图的所述生成、所述至少一个变换矩阵的所述确定和所述第二图像的所述生成利用自动编码器被执行,并且所述自动编码器包括编码器、解码器和渲染引擎,并且其中所述编码器被配置为为所述对象生成所述场景图,所述解码器被配置为基于所述场景图确定所述至少一个变换矩阵,并且所述渲染引擎被配置为基于所述场景图和所述至少一个变换矩阵生成所述第二图像。
11.根据权利要求9所述的系统,其中所述场景图的所述生成、所述至少一个变换矩阵的所述确定和所述第二图像的所述生成利用自动编码器被执行,并且其中所述至少一个处理器还利用无监督学习方法训练所述自动编码器。
12.根据权利要求8所述的系统,其中所述至少一个处理器还:
检测出现在所述图像中的第二对象,其中所述对象具有第一对象类型并且所述第二对象具有第二对象类型;
为所述第二对象生成第二场景图;以及
为所述第二对象确...
【专利技术属性】
技术研发人员:T·L·洪,B·比塞尔,N·M·谭,C·约基姆,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。