【技术实现步骤摘要】
【国外来华专利技术】触觉抓取策略的强化学习
[0001]相关申请的交叉引用
[0002]本申请要求于2019年10月24日提交的题为“触觉抓取策略的强化学习(REINFORCEMENT LEARNING OF TACTILE GRASP POLICIES)”的美国专利申请第16/663,222号的优先权,其全部内容通过引用整体并入本文并用于所有目的。
[0003]至少一个实施例涉及用于执行和促进机器人控制系统的处理资源。例如,至少一个实施例涉及用于训练能够控制触觉机器人抓取的神经网络的处理器或计算系统。
技术介绍
[0004]机器人自动化是一个具有巨大潜力的发展中的
自动化领域中的一个重要问题是物理对象的机器人操纵。通常,为了操纵物理对象,机器人控制系统确定机器人相对于对象的位置和方向的位置和方向,然后定位机器人,使得可以通过机械手或抓手抓取对象。基于对象的特性,从特定方向抓取或抓握对象的特定部分可导致或多或少安全的紧握。考虑到各种各样的对象和潜在的方向,建立牢固的紧握可能非常具有挑战性。因此,改进机器人控制系统以使其能 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种处理器,包括:一个或更多个电路,用于使机器人抓取机制能够至少部分地基于一个或更多个神经网络抓取具有第一体积或小于所述第一体积的对象,所述神经网络仅用体积等于所述第一体积的一个或更多个对象进行训练。2.如权利要求1所述的处理器,其中:具有等于所述第一体积的体积的所述一个或更多个对象包括虚拟包围盒;以及至少部分地基于来自所述机器人抓取机制的一个或更多个传感器的触觉传感器数据进一步训练所述一个或更多个神经网络。3.如权利要求1所述的处理器,其中由所述机器人抓取机制抓取的对象具有不同于用于训练所述一个或更多个神经网络的所述一个或更多个对象的形状。4.如权利要求1所述的处理器,其中:所述机器人抓取机制是具有多个手指的机械手;以及所述多个手指中的每个手指配备有一个或更多个触觉传感器。5.如权利要求2所述的处理器,其中:相机获取待抓取对象的图像;所述图像用于估计所述对象的6d姿态;以及所述虚拟包围盒至少部分地基于所述对象的所述6d姿态而生成。6.如权利要求2所述的处理器,其中所述虚拟包围盒至少部分地基于所述对象的点云而生成。7.如权利要求1所述的处理器,其中:训练所述神经网络至少部分地基于人手进行抓取的一个或更多个图像;以及所述人手进行抓取的图像是奖励函数的组成部分。8.一种系统,包括:一个或更多个电路,用于使机器人抓取机制能够至少部分地基于一个或更多个神经网络抓取具有第一体积或小于所述第一体积的对象,所述神经网络仅用体积等于所述第一体积的一个或更多个对象进行训练;以及一个或更多个存储器,用于存储所述一个或更多个神经网络。9.如权利要求8所述的系统,其中:具有等于所述第一体积的体积的所述一个或更多个对象包括虚拟包围盒;以及至少部分地基于来自所述机器人抓取机制的一个或更多个传感器的触觉传感器数据进一步训练所述一个或更多个神经网络。10.如权利要求8所述的系统,其中训练所述一个或更多个神经网络至少部分地基于提供给所述系统的人类抓取演示来完成。11.如权利要求8所述的系统,其中一个或更多个触觉传感器提供指示与所述对象接触的力感测信息。12.如权利要求8所述的系统,其中:所述机器人抓取机制具有多个指部,所述指部具有多个铰接关节;以及所述系统的动作空间被定义为所述多个铰接关节中的每一个的位置。13.如权利要求8所述的系统,其中:
使用奖励函数训练所述一个或更多个神经网络;以及所述奖励函数至少部分地基于所述机器人抓取机制相对于所述对象的位置。14.如权利要求13所述的系统,其中:所述奖励函数至少部分地基于人手运动的演示;以及所述奖励函数至少部分地基于人手的指...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。