【技术实现步骤摘要】
本公开的实施方案总体上涉及机器人控制和机器学习,并且更具体地涉及用于使用动态增益调节控制机器人的技术。
技术介绍
机器人越来越多地用于在各种环境中自动或自主地执行任务。例如,工业机器人广泛用于制造过程,包括涉及重复和/或可重复任务的过程。然而,尤其是在执行高精度任务时,使用机器人执行任务所面临的持续挑战是有效地控制那些机器人。作为高精度任务的示例,在组装机械时,机器人的任务可能是将钉子插入孔中,其中钉子的外周或表面与孔的壁之间的间隙很小。用于控制机器人执行给定任务的一些常规方法使用确定性算法来引导机器人完成预编程操作序列。一般来说,预编程操作序列必须经过精心规划并以高精度执行,使得考虑到机器人完成任务通常所需的公差和微幅运动。使用确定性算法的一个限制是,此类算法是静态的,并且因此通常不能适应工况的变化。因此,当发生意外变化时(诸如当遇到不同的组件大小和/或位置时),实现确定性算法可导致机器人故障或性能不佳,并且在预编程操作中并未考虑那些变化。用于控制机器人执行任务的另一种常规方法涉及使用通过试错法获得的来自物理机器人与现实世界环境交互的现实世界训练数据来训练机器学 ...
【技术保护点】
1.一种用于控制机器人的计算机实现的方法,所述方法包括:
2.如权利要求1所述的计算机实现的方法,其中生成所述一个或多个机器人命令包括基于所述机器人运动、所述增益和感测到的力来执行一个或多个导纳控制操作。
3.如权利要求2所述的计算机实现的方法,其中所述一个或多个导纳控制操作生成一个或多个顺应运动,并且所述方法还包括基于所述一个或多个顺应运动来生成所述一个或多个机器人命令。
4.如权利要求1所述的计算机实现的方法,其中生成所述机器人运动和所述预测力包括将先前的机器人轨迹和目标回报输入到所述第一经过训练的机器学习模型中,所述第一经过训
...【技术特征摘要】
1.一种用于控制机器人的计算机实现的方法,所述方法包括:
2.如权利要求1所述的计算机实现的方法,其中生成所述一个或多个机器人命令包括基于所述机器人运动、所述增益和感测到的力来执行一个或多个导纳控制操作。
3.如权利要求2所述的计算机实现的方法,其中所述一个或多个导纳控制操作生成一个或多个顺应运动,并且所述方法还包括基于所述一个或多个顺应运动来生成所述一个或多个机器人命令。
4.如权利要求1所述的计算机实现的方法,其中生成所述机器人运动和所述预测力包括将先前的机器人轨迹和目标回报输入到所述第一经过训练的机器学习模型中,所述第一经过训练的机器学习模型输出所述机器人运动和所述预测力。
5.如权利要求1所述的计算机实现的方法,其中确定所述增益包括将所述机器人运动、所述预测力和先前的机器人轨迹输入到所述第二经过训练的机器学习模型中,所述第二经过训练的机器学习模型输出所述增益。
6.如权利要求1所述的计算机实现的方法,其还包括:
7.如权利要求6所述的计算机实现的方法,其中所述模拟数据包括机器人状态数据、机器人运动数据、增益数据、力数据或指示所述机器人是否在所述虚拟环境内成功执行一个或多个任务的数据中的至少一者。
8.如权利要求6所述的计算机实现的方法,其中所述第一机器学习模型和所述第二机器学习模型基于均方误差损失进行训练。
9.如权利要求1所述的计算机实现的方法,其中所述预测力是接触力,并且所述增益是顺应增益。
10.如权利要求1所述的计算机实现的方法,其中所述第一经过训练的机器学习模型和所述第二经过训练的机器学习模型中的每一者包括transformer模型。
11.一种或多种存储指令的非暂时性计算机可读介质,所述指令在由至少一个处理器执行时使所述至少一个处理器执行以下步骤:
12.如权利要求11所述的一种或多种非暂...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。