当前位置: 首页 > 专利查询>索尼公司专利>正文

信息处理装置、信息处理方法和程序制造方法及图纸

技术编号:8959715 阅读:124 留言:0更新日期:2013-07-25 19:16
本发明专利技术公开了信息处理装置、信息处理方法和程序。一种信息处理装置包括:网络学习部分,其通过约束第一权重、第二权重和第三权重并使用学习图像来执行对外观/位置认识网络的学习,其中,外观/位置认识网络具有包括位置节点的前景层、包括背景节点的背景层以及包括像素节点的图像层,并且外观/位置认识网络是将位置节点、背景节点和像素节点彼此相连的神经网络,并且其中,第一权重是位置节点与像素节点之间的连接权重,第二权重是位置节点与背景节点之间的连接权重,并且第三权重是背景节点与像素节点之间的连接权重。

【技术实现步骤摘要】

本专利技术涉及信息处理装置、信息处理方法和程序,并且具体地涉及使得能执行各种动作的诸如机器人之类的代理(agent)能够在执行动作的环境中容易地执行对物体等的学习的信息处理装置、信息处理方法和程序。
技术介绍
例如,在能够执行动作的代理执行物体移动任务的情况中,需要该代理像幼儿进行的对手的关注一样来认识代理被放置于的环境的所捕获图像中的手,在该物体移动任务中,通过使用该图像,在没有先验知识的情况下,代理对作为物体的身体(诸如可由代理本身移动的代理的手)进行移动并且从而移动作为代理的身体之外的物体的非身体。例如,在HarumitsuNOBUTA, Shun NISHIDE, Tetsuya OGATA, HiroshiG.0KUNO, Acquisition of Spatial Map based on Body Schema UsingNeurodynamicalModel,THE 29TH ANNUAL CONFERENCE OF THER0B0TICS SOCIETY OF JAPAN中,提出了一种方法,其中,采用了用于获取身体图解作为内部模型的MTRNN(多时标递归神经网络)并且代理通过使用该MTRNN来在包括该代理的身体的多个物体中识别该代理的身体。在HarumitsuNOBUTA, Shun NISHIDE, Tetsuya OGATA, HiroshiG.0KUN0, Acquisition of Spatial Map based on Body Schema UsingNeurodynamicalModel,THE 29TH ANNUAL CONFERENCE OF THER0B0TICS SOCIETY OF JAPAN中,如下信息被给予MTRNN并且然后该MTRNN被学习:被发出用于由代理移动身体的移动命令、以及在三个物体的环境中的位置信息,这三个物体包括作为响应于移动命令而移动的代理的身体的一个物体以及作为非身体的两个物体。另外,在HarumitsuN0BUTA, Shun NISHIDE, Tetsuya OGATA, HiroshiG.0KUN0, Acquisition of Spatial Map based on Body Schema UsingNeurodynamicalModel,THE 29TH ANNUAL CONFERENCE OF THER0B0TICS SOCIETY OF JAPAN中,仅向被学习后的MTRNN给予移动命令,并且该移动命令被认识。此后,在Harumitsu NOBUTA,ShunNISHIDE, Tetsuya OGATA, Hiroshi G.0KUN0, Acquisition of Spatial Mapbasedon Body Schema Using Neurodynamical Model , THE 29TH ANNUALCONFERENCE OF THEROBOTICS SOCIETY OF JAPAN中,利用来自MTRNN的对移动命令的认识结果来获取(生成)三个物体的位置信息的预测值,并且基于预测值的预测误差来从三个物体的位置信息指出代理的身体的位置信息(以及非身体的位置信息)。此外,沿着位置信息所指示的位置移动的物体被识别为代理的身体。
技术实现思路
然而,在代理中,如果物体的位置信息将要从代理可观察到的图像,即,相机所捕获的图像来获取,则需要识别该图像中希望获取其位置信息的物体,并且为此,需要学习该物体。如果要学习该图像中的物体,则需要提取前景,该前景是将物体印记(impress)在该图像中的部分。作为提取在其上将某个物体印记在图像中的前景的方法,存在如下方法:将用于指定物体的标记放在该物体上并且提取包括标记的闭合区域作为前景的方法,或者在物体移动的前提下基于帧之间的差异来将图像中的移动闭合区域提取作为前景的方法。然而,将标记放在物体上或者从图像提取闭合区域比较麻烦。另外,作为提取前景的其它方法,存在如下方法:预先利用一定方法获取背景并且从图像提取与背景的差异较大的区域作为前景的方法,或者通过使用对诸如人脸或已知物体之类的特定前景进行专门的识别学习的识别设备来识别图像中的前景的方法;然而,预先获取背景或者在识别设备中执行学习也是麻烦的。希望使得能执行动作的诸如机器人之类的代理能够在执行动作的环境中容易地对物体等进行学习。根据本专利技术的一个实施例,提供了一种包括网络学习部分的信息处理装置或者使计算机用作网络学习部分的程序,该网络学习部分通过约束第一权重、第二权重和第三权重并使用学习图像来执行对外观/位置认识网络的学习,其中,所述外观/位置认识网络具有包括作为与图像的前景的位置相对应的神经元的位置节点的前景层、包括作为与图像的背景相对应的神经元的背景节点的背景层以及包括作为与所述前景被叠加在所述背景上的图像的像素相对应的神经元的像素节点的图像层,并且所述外观/位置认识网络是将所述位置节点、所述背景节点和所述像素节点彼此相连的神经网络,其中,所述第一权重是所述位置节点与所述像素节点之间的连接权重,所述第二权重是所述位置节点与所述背景节点之间的连接权重,并且所述第三权重是所述背景节点与所述像素节点之间的连接权重,其中,所述位置节点输出与如下位置信息相对应的值,所述位置信息作为输入值被输入并且指示所述前景的位置,其中,所述背景节点输出通过计算获得的值,所述计算包括所述位置节点的输出的加权求和,以及其中,所述像素节点输出通过计算获得的值,所述计算包括所述位置节点的输出的加权求和以及所述背景节点的输出的加权求和。根据本技术的实施例,提供了一种信息处理方法,包括:通过约束第一权重、第二权重和第三权重并使用学习图像来执行对外观/位置认识网络的学习,其中,所述外观/位置认识网络具有包括作为与图像的前景的位置相对应的神经元的位置节点的前景层、包括作为与图像的背景相对应的神经元的背景节点的背景层以及包括作为与所述前景被叠加在所述背景上的图像的像素相对应的神经元的像素节点的图像层,并且所述外观/位置认识网络是将所述位置节点、所述背景节点和所述像素节点彼此相连的神经网络,其中,所述第一权重是所述位置节点与所述像素节点之间的连接权重,所述第二权重是所述位置节点与所述背景节点之间的连接权重,并且所述第三权重是所述背景节点与所述像素节点之间的连接权重,其中,所述位置节点输出与如下位置信息相对应的值,所述位置信息作为输入值被输入并且指示所述前景的位置,其中,所述背景节点输出通过计算获得的值,所述计算包括所述位置节点的输出的加权求和,以及其中,所述像素节点输出通过计算获得的值,所述计算包括所述位置节点的输出的加权求和以及所述背景节点的输出的加权求和。根据以上实施例,通过约束第一权重、第二权重和第三权重并使用学习图像来执行对外观/位置认识网络的学习。外观/位置认识网络具有包括作为与图像的前景的位置相对应的神经元的位置节点的前景层、包括作为与图像的背景相对应的神经元的背景节点的背景层以及包括作为与所述前景被叠加在所述背景上的图像的像素相对应的神经元的像素节点的图像层,并且所述外观/位置认识网络是将所述位置节点、所述背景节点和所述像素节点彼此相连的本文档来自技高网
...

【技术保护点】
一种信息处理装置,包括:网络学习部分,通过约束第一权重、第二权重和第三权重并使用学习图像来执行对外观/位置认识网络的学习,其中,所述外观/位置认识网络具有包括作为与图像的前景的位置相对应的神经元的位置节点的前景层、包括作为与图像的背景相对应的神经元的背景节点的背景层以及包括作为与所述前景被叠加在所述背景上的图像的像素相对应的神经元的像素节点的图像层,并且所述外观/位置认识网络是将所述位置节点、所述背景节点和所述像素节点彼此相连的神经网络,其中,所述第一权重是所述位置节点与所述像素节点之间的连接权重,所述第二权重是所述位置节点与所述背景节点之间的连接权重,并且所述第三权重是所述背景节点与所述像素节点之间的连接权重,其中,所述位置节点输出与如下位置信息相对应的值,所述位置信息作为输入值被输入并且指示所述前景的位置,其中,所述背景节点输出通过计算获得的值,所述计算包括所述位置节点的输出的加权求和,以及其中,所述像素节点输出通过计算获得的值,所述计算包括所述位置节点的输出的加权求和以及所述背景节点的输出的加权求和。

【技术特征摘要】
2011.12.07 JP 2011-2675601.一种信息处理装置,包括: 网络学习部分,通过约束第一权重、第二权重和第三权重并使用学习图像来执行对外观/位置认识网络的学习, 其中,所述外观/位置认识网络具有包括作为与图像的前景的位置相对应的神经元的位置节点的前景层、包括作为与图像的背景相对应的神经元的背景节点的背景层以及包括作为与所述前景被叠加在所述背景上的图像的像素相对应的神经元的像素节点的图像层,并且所述外观/位置认识网络是将所述位置节点、所述背景节点和所述像素节点彼此相连的神经网络, 其中,所述第一权重是所述位置节点与所述像素节点之间的连接权重,所述第二权重是所述位置节点与所述背景节点之间的连接权重,并且所述第三权重是所述背景节点与所述像素节点之间的连接权重, 其中,所述位置节点输出与如下位置信息相对应的值,所述位置信息作为输入值被输入并且指示所述前景的位置, 其中,所述背景节点输出通过计算获得的值,所述计算包括所述位置节点的输出的加权求和,以及 其中,所述像素节点输出通过计算获得的值,所述计算包括所述位置节点的输出的加权求和以及所述背景节点的输出的加权求和。2.根据权利要求1所述的信息处理装置,其中,关于任何两个位置节点,所述网络学习部分将所述第一权重约束为使得所述两个位置节点中的一个位置节点与位于与该一个位置节点所对应的位置具有预定位置关系的位置处的像素所对应的像素节点之间的第一权重、和所述两个位置节点中的另一个位置节点与位于与该另一个位置节点所对应的位置具有所述预定位置关系的位置处的像素所对应的像素节点之间的第一权重为相同值,并且 其中,关于每个位置节点,所述网络学习部分将所述位置节点与如下背景节点之间的第二权重约束为用于抑制所述背景节点的突显的固定值,并且执行对所述外观/位置认识网络的学习,所述背景节点与以所述位置节点所对应的位置为基准的预定范围中的背景相对应。3.根据权利要求2所述的信息处理装置,其中,关于每个背景节点,所述网络学习部分将所述背景节点与如下像素节点之间的第三权重约束为O并且执行对所述外观/位置认识网络的学习,所述像素节点与所述背景节点所对应的背景的像素之外的像素相对应。4.根据权利要求3所述的信息处理装置,其中,所述网络学习部分执行对所述外观/位置认识网络的学习以减小预测图像相对于所述学习图像的误差,所述预测图像是以从所述外观/位置认识网络的像素节点输出的值为像素值的图像。5.根据权利要求4所述的信息处理装置,还包括: 多时标递归神经网络学习部分,通过使用用于减小所述预测图像相对于包括响应于用于移动作为前景的物体的移动命令而移动的物体的图像的序列的误差的、作为所述外观/位置认识网络的位置节点的输入值的所述位置信息的序列和所述移动命令的序列,来执行对多时标递归神经网络的学习;以及 识别单元,针对包括在识别数据中的移动命令的序列的输入,基于从所述多时标递归神经网络输出的位置信息的预测值的序列的误差,来识别包括在所述识别数据中的图像中的前景是否是响应于所述识别数据中的移动命令而移动的物体,所述识别数据包括所述移动命令的序列和所述图像的序列并且用来识别响应于移动命令而移动的物体。6.根据权利要求5所述的信息处理...

【专利技术属性】
技术研发人员:信田春满河本献太佐部浩太郎野田邦昭
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1