信息处理设备、信息处理方法和程序技术

技术编号:21637617 阅读:22 留言:0更新日期:2019-07-17 14:04
提供了一种信息处理设备,包括处理器,该处理器提供:获取与对象有关的词典数据的词典数据获取功能;获取对象的第一图像的图像获取功能;第一角度估计功能,其基于第一图像和词典数据估计第一图像中对象的角度;第二角度估计功能,其在对象的物理操作后重新估计第一图像中对象的角度;以及词典数据更新功能,根据第一角度估计功能估计的结果和第二角度估计功能的重新估计的结果更新词典数据。

Information Processing Equipment, Information Processing Methods and Procedures

【技术实现步骤摘要】
【国外来华专利技术】信息处理设备、信息处理方法和程序
本专利技术涉及信息处理设备、信息处理方法和程序。
技术介绍
基于图像的对象识别是当今常见的技术。在基于图像的对象识别中,图像中的对象被识别,例如,通过提取成像设备捕获的图像的特征量,并在特征量和预先注册为词典数据的特征量之间进行匹配。在这种情况下,更改图像中对象的角度会导致特征量的变化;因此,有必要为对象的每个角度准备词典数据,以增强对象识别的可用性。PTL1和PTL2是在基于图像的对象识别中为对象的每个角度准备词典数据的技术示例。PTL1描述了基于八个图像识别对象的技术,这八个图像是通过以45度的间隔旋转对象获得的。PTL2描述了通过从许多图像中识别公共部分来学习对象模型的技术,这些图像是通过在水平角方向和天顶角方向上以5度或类似的间隔旋转对象获得的。引用列表专利文献〔PTL1〕JP2003-346152A〔PTL2〕美国专利申请公开号2013/0202212
技术实现思路
技术问题上述技术用于识别图像中的对象,即估计图像中对象的身份,并且不打算进一步从图像中提取附加信息。然而,如果考虑到对象识别技术最近已应用于不同领域,则基于图像提供关于对象的附加信息被认为是有利的。因此,本专利技术的目的是提供一种新颖和改进的信息处理设备、信息处理方法和程序,该信息处理设备、信息处理方法和程序能够基于图像估计对象的角度并自动更新数据以用于估计。问题解决方案根据本专利技术的一个方面,提供了一种信息处理设备,包括:处理器,其实现获取与对象有关的词典数据的词典数据获取功能;获取对象的第一图像的图像获取功能,;第一角度估计功能,其基于第一图像和词典数据估计第一图像中对象的角度;第二角度估计功能,在与对象相关的物理操作后重新估计第一图像中对象的角度;以及词典数据更新功能,其响应于第一角度估计功能估计的结果和第二角度估计功能重新估计的结果更新词典数据。此外,根据本专利技术的另一方面,提供了一种信息处理方法,包括:获取与对象有关的词典数据的步骤;获取对象的第一图像的步骤;基于第一图像和词典数据估计第一图像中对象的角度的步骤;在与对象相关的物理操作后,重新估计第一图像中对象的角度的步骤;以及响应于估计的结果和重新估计的结果,通过处理器更新词典数据的步骤。此外,根据本专利技术的又一方面,提供了一种程序,用于使处理器实现:获取与对象有关的词典数据的词典数据获取功能;获取对象的第一图像的图像获取功能;第一角度估计功能,基于第一图像和词典数据估计第一图像中对象的角度;第二角度估计功能,在与对象相关的物理操作后,重新估计第一图像中对象的角度;以及词典数据更新功能,其响应于第一角度估计功能估计的结果和第二角度估计功能重新估计的结果更新词典数据。附图说明图1是根据本专利技术第一实施例的系统的示意图。图2是描述图1所示系统中终端的功能配置的框图。图3是描绘图1所示系统中使用的相机平台设备和夹具的配置的示意性透视图。图4是沿着图3的线I-I做出的横截面图。图5是在本专利技术第一实施例中生成的词典数据的概念解释图。图6是图1所示系统中机器人的示意性配置的解释图。图7是描述图1所示系统中机器人功能配置的框图。图8是描述本专利技术第一实施例中词典数据生成处理的示例的流程图。图9是描述本专利技术第一实施例中的识别处理的示例的流程图。图10是描述本专利技术第一实施例中修剪处理的示例的流程图。图11是图10所示修剪处理的概念解释图。图12是描述本专利技术第一实施例中词典数据更新处理的示例的流程图。图13是描述本专利技术第二实施例中机器人的功能配置的框图。图14是本专利技术第三实施例的示意性解释图。图15是描述根据本专利技术的第三实施例的机器人的功能配置的框图。图16是描述根据本专利技术实施例的信息处理设备的硬件配置的框图。具体实施方式下文将参照附图详细描述本专利技术的几个实施例。应当注意的是,具有基本相同功能配置的组成元件由相同的参考符号表示,并且不会在本说明书和附图中重复描述。(第一实施例)图1是根据本专利技术第一实施例的系统10的示意图。参照图1,系统10包括终端100、数据库200和通过网络NW彼此连接的机器人300。相机150和相机平台设备160连接到终端100。机器人300包括相机310和机械臂320。在上述系统10中,相机150捕获通过稍后描述的夹具170安装在相机平台设备160上的对象obj的图像。终端100从相机150获取图像,并从相机平台设备160获取指示对象obj角度的角度信息。应当注意的是,对象obj的角度是三维空间中的角度,例如,正交坐标系中关于三个轴的旋转量表示的角度。终端100基于获取的图像和角度信息(以及与对象obj有关的标识信息)生成词典数据。所生成的词典数据存储在数据库200中。同时,在机械臂320夹持对象obj的状态下,机器人300使用相机310捕获对象obj的图像。机器人300识别图像中的对象obj,并基于从数据库200获取的捕获图像和词典数据进一步估计图像中对象obj的角度。因此,机器人300可以在识别出对象obj后,进一步估计被机械臂320抓住的对象obj的角度。例如,该角度表示对象obj相对于参考姿势旋转的程度。例如,机器人300可以基于角度估计结果通过控制机械臂320来旋转对象obj,并且从而使对象obj处于所需的位置。上述系统10在使用机器人300安排或组织物品的自动工作时很有用。系统10还可用于识别如何旋转对象obj以例如读取放置在对象obj的预定位置上的信息(打印代码、射频标识符(RFID)等)。应当注意的是,系统10的使用应用不仅限于上述示例,还可以包括其他各种使用应用。(用于生成词典数据的配置)图2是描述图1所示的系统中终端100的功能配置的框图。参照图2,终端100包括图像获取部分110、角度信息获取部分120和词典数据生成部分130。终端100例如是个人计算机、平板电脑或智能手机,并且终端100中各部分的功能通过稍后描述的信息处理设备的硬件配置实现。具体来说,例如图像获取部分110、角度信息获取部分120和词典数据生成部分130的功能由包含在信息处理设备中的处理器实现。词典数据生成部分130生成的词典数据210存储在通过网络连接到终端100的数据库200中。数据库200的功能由连接到网络的一个或多个信息处理设备中的存储器实现。应当注意的是,在终端100包括多个处理器的情况下,多个处理器可以合作实现上述部分的功能。或者,服务器可以实现终端100中处理器实现的部分或全部功能,如后文所述。各部分的功能如下所述。图像获取部分110获取由相机150捕获的对象obj的图像。在这里,相机150是捕获对象的图像的成像设备的示例。具体来说,相机150是例如包括图像传感器的数字相机,图像获取部分110接收由相机150生成的图像数据。尽管在图2所示的示例中相机150通过有线通信接口(诸如通用串行总线(USB))连接到终端100,在另一示例中相机150也可以通过无线通信接口(诸如蓝牙(注册商标)通信接口)连接到终端100。或者,相机150可并入终端100中,并通过总线将图像数据传输到图像获取部分110。角度信息获取部分120从相机平台设备160获取指示对象obj角度的角度信息。这里,在本实施例中,由终端100中的角度信息获取部分120获取的角度信本文档来自技高网...

【技术保护点】
1.一种信息处理设备,包括:处理器,所述处理器实现:获取与对象有关的词典数据的词典数据获取功能;获取所述对象的第一图像的图像获取功能;第一角度估计功能,其基于所述第一图像和所述词典数据估计所述第一图像中所述对象的角度;第二角度估计功能,其在与所述对象相关的物理操作后重新估计所述第一图像中所述对象的角度;以及词典数据更新功能,其响应于所述第一角度估计功能估计的结果和所述第二角度估计功能重新估计的结果,更新所述词典数据。

【技术特征摘要】
【国外来华专利技术】2016.12.05 JP 2016-2362771.一种信息处理设备,包括:处理器,所述处理器实现:获取与对象有关的词典数据的词典数据获取功能;获取所述对象的第一图像的图像获取功能;第一角度估计功能,其基于所述第一图像和所述词典数据估计所述第一图像中所述对象的角度;第二角度估计功能,其在与所述对象相关的物理操作后重新估计所述第一图像中所述对象的角度;以及词典数据更新功能,其响应于所述第一角度估计功能估计的结果和所述第二角度估计功能重新估计的结果,更新所述词典数据。2.根据权利要求1所述的信息处理设备,其中,所述词典数据更新功能基于所述第一图像和指示由所述第二角度估计功能重新估计的所述对象的所述角度的角度信息,更新所述词典数据。3.根据权利要求1或2所述的信息处理设备,其中,在所述第一角度估计功能估计的所述对象的所述角度的可靠性不超过阈值的情况下,所述词典数据更新功能基于所述第二角度估计功能的所述重新估计的所述结果更新所述词典数据。4.根据权利要求1至3中任一项所述的信息处理设备,其中,所述图像获取功能在与所述对象相关的所述物理操作之后获取所述对象的第二图像,所述第一角度估计功能基于所述第二图像和所述词典数据,估计所述第二图像中所述对象的角度,并且所述第二角度估计功能基于所述对象的所述角度以及与所述对象相关的所述物理操作量,重新估计所述第一图像中所述对象的角度,其中所述对象的所述角度是由所述第一角度估计功能基于所述第二图像和所述词典数据估计的。5.根据权利要求4所述的信息处理设备,其中,在由所述第一角度估计功能基于所述第二图像和所述词典数据估计的所述对象的所述角度的所述可靠性不超过所述阈值的情况下,所述图像获取功能在重新执行与所述对象相关的所述物理操作后获取所述对象的第三图像,所述第一角度估计功能基于所述第三图像和所述词典数据估计所述第三图像中所述对象的角度,并且在由所述第一角度估计功能基于所述第三图像和所述词典数据估计的所述对象的所述角度的所述可靠性超过所述阈值的情况下,所述第二角度估计功能基于所述对象的所述...

【专利技术属性】
技术研发人员:永塚仁夫山岸建
申请(专利权)人:索尼互动娱乐股份有限公司
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1