基于捕获物体的图像的机器学习方法和装置制造方法及图纸

技术编号：34768494 阅读：23 留言：0更新日期：2022-08-31 19:24

本说明书的一些实施方式通常涉及深度机器学习方法和装置，其涉及预测响应于机器人在环境中的特定运动而将对机器人的环境中的物体发生的运动(如果有的话)。一些实施方式涉及训练深度神经网络模型以预测机器人环境的图像的至少一个变换(如果有的话)，其将作为实现机器人在环境中的特定运动的至少一部分的结果而发生。训练的深度神经网络模型可以基于包括图像和定义特定运动的部分的一组机器人运动参数的输入来预测变换。动参数的输入来预测变换。动参数的输入来预测变换。

全部详细技术资料下载

【技术实现步骤摘要】
基于捕获物体的图像的机器学习方法和装置
[0001]本申请是2017年5月16日申请并于2018年11月20日进入中国国家阶段的中国专利技术专利申请第201780031172.7号(专利技术名称：与基于捕获物体的图像并且基于用于环境中的未来机器人运动的参数来预测机器人环境中的物体运动有关的机器学习方法和装置)的分案申请。

[0002]本专利技术涉及基于捕获物体的图像并且基于用于环境中的未来机器人运动的参数来预测机器人环境中的物体运动有关的机器学习方法和装置。

技术介绍

[0003]许多机器人被编程为利用一个或多个末端执行器来操纵一个或多个物体。例如，机器人可以利用末端执行器将力施加到物体上并引起该物体的运动。例如，机器人可以利用抓握末端执行器或其他末端执行器来移动物体而不必抓住该物体。此外，例如，机器人可以利用抓握末端执行器比如“冲击式”抓取器或“渐进式”抓取器(例如使用销、针等物理地穿透物体)从第一位置拾取物体，将物体移动到第二位置，然后在第二位置放下物体。

技术实现思路

[0004]本说明书的一些实施方式通常涉及深度机器学习方法和装置，其涉及预测响应于机器人在环境中的特定运动而将对机器人的环境中的物体发生的运动(如果有的话)。一些实施方式涉及训练深度神经网络模型以预测机器人环境的图像的至少一个变换(如果有的话)，其将作为实现机器人在环境中的特定运动的至少一部分的结果而发生。训练的深度神经网络模型可以基于包括(1)图像和(2)定义特定运动的部分的机器人运动参数的输入来预测变换。可以利用预测的...

【技术保护点】

【技术特征摘要】
1.一种由一个或多个处理器实施的方法，包括：生成候选机器人运动参数，所述候选机器人运动参数定义可由机器人的一个或多个部件在机器人的环境中执行的候选运动的至少一部分；识别由与机器人相关的视觉传感器捕获的当前图像，所述当前图像捕获机器人的环境的至少一部分；将所述当前图像和候选机器人运动参数作为输入应用于训练的神经网络；生成所述当前图像的至少一个预测变换，基于将所述当前图像和候选机器人运动参数应用于训练的神经网络来生成所述预测变换；基于所述至少一个预测变换来变换所述当前图像以生成至少一个预测图像，如果候选运动的至少一部分由机器人的部件在所述环境中执行，则所述预测图像预测机器人的环境的所述部分；基于所述预测图像确定执行第二候选运动替代所述候选运动；以及将一个或多个控制命令提供到所述机器人的一个或多个致动器，以执行所述第二候选运动。2.根据权利要求1所述的方法，还包括：基于将所述当前图像和候选机器人运动参数应用于训练的神经网络，生成至少一个合成掩模；其中，变换所述当前图像还基于所述至少一个合成掩模。3.根据权利要求2所述的方法，其中，所述至少一个预测变换包括多个预测变换，其中，所述至少一个合成掩模包括多个合成掩模，并且其中，基于所述至少一个预测变换来变换所述当前图像以生成所述预测图像包括：基于所述多个预测变换生成多个预测图像；和基于所述多个合成掩模合成预测图像以生成所述预测图像。4.根据权利要求1所述的方法，还包括：生成第二候选机器人运动参数，所述第二候选机器人运动参数定义所述第二候选运动的至少一部分；将所述当前图像和第二候选机器人运动参数作为输入应用于训练的神经网络；生成所述当前图像的至少一个第二预测变换，基于将所述当前图像和第二候选机器人运动参数应用于训练的神经网络来生成所述第二预测变换；基于所述第二预测变换来变换所述当前图像的一个或多个像素以生成至少一个第二预测图像，如果所述第二候选运动的至少一部分由机器人的部件在所述环境中执行，则所述第二预测图像预测机器人的环境的所述部分。5.根据权利要求4所述的方法，还包括：基于所述第二预测图像，选择所述第二候选运动。6.根据权利要求5所述的方法，还包括：生成连续候选机器人运动参数，所述连续候选机器人运动参数定义在所述第二候选运动的所述部分之后的所述第二候选运动的另一部分；将所述预测图像和连续候选机器人运动参数应用于训练的神经网络；生成所述预测图像的至少一个连续预测变换，基于将所述预测图像和连续候选机器人
运动参数应用于训练的神经网络来生成所述预测图像的至少一个连续预测变换；基于所述连续预测变换来变换所述预测图像以生成连续预测图像。7.根据权利要求6所述的方法，还包括：进一步基于所述连续预测图像，选择所述第二候选运动。8.根据权利要求1所述的方法，其中，所述训练的神经网络包括多个堆叠的卷积长短期存储层。9.根据权利要求1所述的方法，其中，所述当前图像的像素的至少一个预测变换包括一个或多个空间变换器的参数。10.根据权利要求9所述的方法，其中，变换...

【专利技术属性】
技术研发人员：S莱文，C芬恩，I古德费洛，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人