信息处理系统和学习方法技术方案

技术编号：34237410 阅读：20 留言：0更新日期：2022-07-24 08:29

信息处理系统(1)具有移动量数据获取单元(109)、图像数据获取单元(101)、差分表达式提取单元(108)和镜面区域指定单元(111)。移动量数据获取单元(109)获取物体的移动量数据。图像数据获取单元(101)获取由安装在物体上的成像装置捕获的图像数据项目。差分表达式提取单元(108)基于在物体的移动之前和之后成像的两个图像数据项目来提取表示关于两个图像之间的差异的特征信息的差分表达式。镜面区域指定单元(111)基于差分表达式与移动量数据之间的相关性来指定镜面区域。相关性来指定镜面区域。相关性来指定镜面区域。

Information processing system and learning method

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】信息处理系统和学习方法

[0001]本专利技术涉及信息处理系统和学习方法。

技术介绍

[0002]在使用视觉传感器的物体检测中，反射镜中反射的物体也以与其他方式相同的方式检测。因此，难以识别反射镜本身。非专利文献1提出了一种技术，其中，通过视频捕获在特定方向上移动的预定图案，并且提取相同图案在不同方向上移动的区域并且将其识别为镜面区域。
[0003]非专利文献
[0004]非专利文献1："REGION IDENTIFICATION TECHNIQUE FOR MIRROR SURFACE/TRANSPARENT OBJECT",Toshiba Review Vol.68No,10(2013)

技术实现思路

[0005]然而，在上述传统技术中，当在成像区域中存在示出类似动作的另一图案时，存在图案的检测区域被错误地识别为镜面区域的可能性。
[0006]因此，本公开提出了能够准确地检测镜面区域的信息处理系统和执行信息处理的神经网络的学习方法。
[0007]问题的解决方案
[0008]根据本公开，提供了一种信息处理系统，包括：操作量数据获取单元，获取物体的操作量数据；图像数据获取单元，获取由安装在所述物体上的成像装置捕获的图像数据；差分表达式提取单元，基于在所述物体的操作之前和之后捕获的两条图像数据，提取表示关于所述两条图像数据之间的差异的特征信息的差分表达式；以及镜面区域识别单元，其基于所述差分表达式与所述操作量数据之间的相关性来识别镜面区域。
[0009]根...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种信息处理系统，包括：操作量数据获取单元，获取物体的操作量数据；图像数据获取单元，获取由安装在所述物体上的成像装置捕获的图像数据；差分表达式提取单元，基于在所述物体的操作之前和之后捕获的两条图像数据，提取表示关于所述两条图像数据之间的差异的特征信息的差分表达式；以及镜面区域识别单元，基于所述差分表达式与所述操作量数据之间的相关性，识别镜面区域。2.根据权利要求1所述的信息处理系统，还包括：差分编码器，从所述两条图像数据提取扩展的差分表达式，所述扩展的差分表达式包括由所述物体的运动引起的所述两条图像数据之间的差异的特征信息以及不是由所述物体的运动引起的所述两条图像数据之间的差异的特征信息，其中，所述差分表达式提取单元从所述扩展的差分表达式中选择性地提取表示由所述物体的运动引起的所述两条图像数据之间的所述差异的所述特征信息的所述差分表达式。3.根据权利要求2所述的信息处理系统，其中，所述操作量数据获取单元在从时间t1到时间t
T
的多个时间处获取操作量数据，其中，T是2或更大的整数，所述图像数据获取单元在所述多个时间处获取图像数据，所述差分编码器从时间t
k
处的图像数据以及紧接在所述时间t
k
之前的时间t
k
‑1处的图像数据的恢复表达式中提取在所述时间t
k
处的扩展的差分表达式，其中，k是2至T的整数，所述差分表达式提取单元从所述时间t
k
处的所述扩展的差分表达式中提取在所述时间t
k
处的差分表达式，所述差分表达式表示由所述物体的运动引起的特征信息，并且所述镜面区域识别单元基于在所述多个时间处的差分表达式与在所述多个时间处的操作量数据之间的相关性，识别所述镜面区域。4.根据权利要求3所述的信息处理系统，其中，所述差分编码器是其中通过机器学习优化权重的神经网络，所述机器学习包括使用在多个时间处的静止物体的学习图像数据的学习过程，所述学习过程包括：生成在所述时间t1处的学习图像数据的恢复表达式，将在时间t
q
处的学习图像数据以及紧接在所述时间t
q
之前的时间t
q
‑1处的学习图像数据的恢复表达式输入到所述差分编码器，以提取在所述时间t
q
处的扩展的差分表达式，其中，q是2或更大的整数；将在所述时间t
q
处的所述扩展的差分表达式输入到校正单元，以执行校正，以将表示在所述时间t
q
处的所述扩展的差分表达式的张量的部分重写为零，将在所述时间t
q
‑1处的所述学习图像数据的恢复表达式和噪声加到所述校正之后的所述时间t
q
处的所述扩展的差分表达式以生成在所述时间t
q
处的学习图像数据的恢复表达式，通过图像解码器解码在所述时间t
q
处的所述学习图像数据的恢复表达式，以生成在所述时间t
q
处的恢复图像数据，计算在所述时间t
q
处的所述恢复图像数据与在所述时间t
q
处的所述学习图像数据之间
的恢复误差，以及重复调整表示图像编码器、所述差分编码器、所述校正单元和所述图像解码器的神经网络的权重，直到所述恢复误差满足预定标准，并且所述差分表达式提取单元提取表示所述扩展的差分表达式的张量的由所述校正单元重写为零的部分作...

【专利技术属性】
技术研发人员：岛田大树，西川德宏，佐藤达人，
申请(专利权)人：索尼集团公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人