用于辨识新对象的机器视觉系统技术方案

技术编号：25127786 阅读：22 留言：0更新日期：2020-08-05 02:57

描述了一种用于对图像中的新对象进行分类的系统。在操作中，该系统使用多层网络从多个未标注图像提取显著图块。将多层网络的激活聚类成关键属性，在显示器上向用户显示该关键属性，从而提示用户利用类标签来对关键属性进行标注。然后基于所提示的关键属性的用户标注生成属性数据库。然后可以使测试图像通过该系统，以允许该系统通过在属性数据库中识别对象类来对测试图像中的至少一个对象进行分类。最终，可以基于测试图像中的至少一个对象的分类来使设备进行操作或操纵。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于辨识新对象的机器视觉系统相关申请的交叉引用本申请要求于2018年2月6日提交的美国非临时专利申请62/627,150的权益，其全部内容通过引用并入本文中。
技术介绍
(1)
本专利技术涉及对象辨识系统，并且更具体地，涉及用于辨识新对象的机器视觉系统。(2)相关技术的描述对象辨识系统通常用于基于各种对象特征来识别场景或设置中的对象。最近，已经在基于对象的部分或属性来描述对象方面进行了大量工作。例如，Farhadi等人使用对象属性(例如，“具有头”、“具有毛”和“四条腿的”)来描述对象，并且仅基于一些标注数据使用这些属性来学习对象的新类(参见所并入的参考文献的列表，参考文献6)。另一相关的方法是Russakovsky等人的方法(参见参考文献1)。Russakovsky等人的作者使用亚马逊土耳其机器人(AMT：AmazonMechanicalTurk)来标注预定义属性在大量图像中的存在或不存在。接下来，以有监督方式学习针对属性的二进制分类器，并使用这些分类器来执行零次转移(zero-shottransfer)。各种零次学习(ZSL：zero-shotlearning)技术还使用人类标注或设计的属性，例如，Romera-Paredes等人的工作结果(参见参考文献5)或Akata等人的工作结果(参见参考文献4)。然而，这些属性学习方法需要大量标注图像以及许多预定义属性(这可能与手头的辨识任务无关)。因此，持续需要一种系统，该系统利用预训练的对象检测网络从数据中获得未标注的关键属性的小...

【技术保护点】
1.一种用于对图像中的新对象进行分类的系统，所述系统包括：/n存储器和一个或更多个处理器，所述存储器是编码有可执行指令的非暂时性计算机可读介质，使得在执行所述指令时，所述一个或更多个处理器执行以下操作：/n使用多层网络从多个未标注图像提取显著图块；/n将所述多层网络的激活聚类成关键属性；以及/n在显示器上向用户显示所述关键属性，并且提示所述用户利用类标签对所述关键属性进行标注；/n基于用户生成的所述关键属性的标注来生成属性数据库；/n从测试图像提取显著图块，所述测试图像具有与所述显著图块相关联的至少一个对象；/n将所述显著图块映射到二进制属性向量，所述二进制属性向量指示关键属性在所述测试图像中的存在或不存在；/n通过在所述属性数据库中识别与所述二进制属性向量对应的对象类，对所述测试图像中的至少一个对象进行分类；以及/n基于所述测试图像中的所述至少一个对象的分类来控制设备。/n

【技术特征摘要】
【国外来华专利技术】20180206 US 62/627,1501.一种用于对图像中的新对象进行分类的系统，所述系统包括：
存储器和一个或更多个处理器，所述存储器是编码有可执行指令的非暂时性计算机可读介质，使得在执行所述指令时，所述一个或更多个处理器执行以下操作：
使用多层网络从多个未标注图像提取显著图块；
将所述多层网络的激活聚类成关键属性；以及
在显示器上向用户显示所述关键属性，并且提示所述用户利用类标签对所述关键属性进行标注；
基于用户生成的所述关键属性的标注来生成属性数据库；
从测试图像提取显著图块，所述测试图像具有与所述显著图块相关联的至少一个对象；
将所述显著图块映射到二进制属性向量，所述二进制属性向量指示关键属性在所述测试图像中的存在或不存在；
通过在所述属性数据库中识别与所述二进制属性向量对应的对象类，对所述测试图像中的至少一个对象进行分类；以及
基于所述测试图像中的所述至少一个对象的分类来控制设备。

2.根据权利要求1所述的系统，其中，基于优化例程对所述至少一个对象进行分类，所述优化例程最小化类的文本属性的所述二进制属性向量与所述测试图像的所述关键属性的所述二进制属性向量之间的距离。

3.根据权利要求1所述的系统，其中，控制所述设备包括：基于所述测试图像中的所述至少一个对象的所述分类来使所述设备进行操纵。

4.根据权利要求1所述的系统，其中，所述属性数据库包括由对象类和描述各个对象的对应文本属性构成的库。

5.根据权利要求1所述的系统，其中，所述多层网络是神经网络，并且针对图像中的各个图像像素或像素组基于所述神经网络的激活来提取显著图块。

6.一种用于对图像中的新对象进行分类的计算机程序产品，所述计算机程序产品包括：
非暂时性计算机可读介质，所述非暂时性计算机可读介质上编码有可执行指令，使得在由一个或更多个处理器执行所述可执行指令时，所述一个或更多个处理器执行以下操作：
使用多层网络从多个未标注图像提取显著图块；
将所述多层网络的激活聚类成关键属性；以及
在显示器上向用户显示所述关键属性，并且提示所述用户利用类标签对所述关键属性进行标注；
基于用户生成的所述关键属性的标注来生成属性数据库；
从测试图像提取显著图块，所述测试图像具有与所述显著图块相关联的至少一个对象；
将所述显著图块映射到二进制属性向量，所述二进制属性向量指示关键属性在所述测试图像中的存在或不存在；
通过在所述属性数据库中识别与所述二进制属性...

【专利技术属性】
技术研发人员：S·科洛瑞，C·E·马丁，金劲男，H·霍夫曼，
申请(专利权)人：赫尔实验室有限公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人