【技术实现步骤摘要】
用于生成机器人任务演示的神经网络
[0001]相关申请的交叉引用
[0002]本公开主张2021年12月17日提交的标题为“用于实现变换器以收集机器人任务演示的技术(TECHNIQUES FOR IMPLEMENTING TRANSFORMERS TO COLLECT ROBOTIC TASK DEMONSTRATIONS)”且具有序列号63/291205的美国临时专利申请的权益。在此通过引用将相关申请的主题并入本文。
[0003]本公开的实施例总体上涉及机器学习和机器人技术,更具体地说,涉及实现神经网络以生成机器人任务演示。
技术介绍
[0004]机器人可以在不同的现实环境中(例如工业、家庭或护理环境)自动执行物理任务。通常,机器学习技术用于训练机器人以在这些类型的现实环境中执行物理任务。例如,可以使用机器学习技术对机器人进行训练,以自动执行装配任务、涉及拾取和放置对象的任务、包装任务、对象堆叠任务和/或其他类似的物理任务。许多机器学习的实现都涉及训练神经网络,使机器人能够在没有人工输入和/或人机交互的情况
【技术保护点】
【技术特征摘要】
1.一种用于训练神经网络以实现机器人任务的计算机实现的方法,所述计算机实现的方法包括:基于与在模拟环境中执行第一任务的第一机器人相关联的第一多个任务演示生成多个输入向量,其中包括在所述多个输入向量中的每个输入向量指定所述第一机器人末端执行器的姿势序列;以及训练所述神经网络以基于所述多个输入向量生成多个输出向量。2.根据权利要求1所述的计算机实现的方法,其中训练所述神经网络包括:将包括在所述多个输入向量中的第一输入向量输入到所述神经网络,其中所述第一输入向量指定所述末端执行器的第一姿势序列;以及训练所述神经网络以基于所述第一输入向量预测第一输出向量,其中所述第一输出向量包括所述末端执行器的第二姿势序列,所述第二姿势序列在所述末端执行器的所述第一姿势序列之后。3.根据权利要求1所述的计算机实现的方法,其中所述第一机器人的所述末端执行器的第一姿势包括所述末端执行器在所述模拟环境中的位置和方向。4.根据权利要求1所述的计算机实现的方法,其中包括在所述多个输入向量中的每个输入向量进一步指定所述第一机器人的所述末端执行器的抓握状态序列。5.根据权利要求1所述的计算机实现的方法,其中训练所述神经网络包括:将包括在所述多个输入向量中的第一输入向量输入到所述神经网络,其中所述第一输入向量指定所述末端执行器的第一抓握状态序列;以及训练所述神经网络以基于所述第一输入向量预测第一输出向量,其中所述第一输出向量包括所述末端执行器的第二抓握状态序列,所述第二抓握状态序列在所述末端执行器的所述第一抓握状态序列之后。6.根据权利要求1所述的计算机实现的方法,其中包括在所述多个输入向量中的每个输入向量进一步指定与所述模拟环境中的至少一个对象相关联的姿势序列。7.根据权利要求1所述的计算机实现的方法,其中训练所述神经网络包括:将包括在所述多个输入向量中的第一输入向量输入到所述神经网络,其中所述第一输入向量指定所述模拟环境中至少一个对象的第一姿势序列;以及训练所述神经网络以基于所述第一输入向量预测第一输出向量,其中所述第一输出向量包括所述模拟环境中的所述至少一个对象的第二姿势序列,所述第二姿势序列在所述模拟环境中的所述至少一个对象的所述第一姿势序列之后。8.根据权利要求1所述的计算机实现的方法,其中包括在所述多个输入向量中的所述输入向量均未指定所述第一机器人的配置参数。9.根据权利要求1所述的计算机实现的方法,还包括基于与在模拟环境中执行第二任务的第二机器人相关联的第二多个任务演示来重新训练所述神经网络,以生成专用神经网络,其中所述第二任务与所述第一任务不同。10.根据权利要求9所述的计算机实现的方法,其中所述第一机器人由第一组配置参数定义,所述第二机器人由与所述第一组配置参数不同的第二组配置参数定义。11.一个或更多个非暂态计算机可读介质,其存储有指令,当由一个或更多个处理器执行所述指令时,通过执行以下步骤,使所述一个或更多个处理器训练神经网络以启用机器
人任务:基于与在模拟环境中执行第一任务的第一机器人相关联的第一多个任务演示生成多个输入向量,其中包括在...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。