通过机器人操纵对象的方法和操纵系统技术方案

技术编号:32624964 阅读:29 留言:0更新日期:2022-03-12 17:57
一种方法,其中在遵守约束(NB),特别是障碍物(H1,H2,H3)的情况下生成机器人(R)对对象(OB)从起始状态(MS)到操纵目标(MT)的运动或操纵,其中操纵划分为不同的操纵模式(M1,M2,M3)或子段,所述不同的操纵模式或子段包括不同的约束(NB),其中随机生成(RGEN)多个操纵模式特定的调节器(R1,R2,R3,R4)以用于调节在不同操纵模式(M1,M2,M3)或子段中的子操纵,并且随机生成(SGEN)所述调节器(R1,R2,R3,R4)的优化序列,特别是所述调节器的序列,其中特别是由调节器(R1,R2,R3,R4)指定向量场或方向场,其中模拟模块(SIM)针对每个调节器序列(RS)模拟所述操纵或所述运动,并确定对到达所述操纵目标(MT)进行量化的耗费值(AW)或成本值,以及其中所述调节器序列(RS)和所述耗费值(AW)作为训练数据被输送给机器学习模块(NN),以说明优化耗费的调节器(OR),该调节器例如优化或最小化所述耗费值(AW)。借助于优化耗费的调节器(OR),基于以传感器方式检测到的当前操纵状态(AMZ)生成用于操控所述机器人(R)的控制数据(CD)。(CD)。(CD)。

【技术实现步骤摘要】
【国外来华专利技术】通过机器人操纵对象的方法和操纵系统

技术介绍

[0001]在许多领域,特别是在产品制造、物流以及许多服务中,越来越多地使用机器人,特别是工业机器人、服务机器人、运输机器人、门式机器人或其他用于操纵对象的自动化操纵系统。在这种情况下,典型的操纵任务特别是包括对象的抓取、加工和/或处理。例如,机器人可以首先将相机移动到要操纵的对象上方,借助于所述相机来定位所述对象,将夹具移动到所述对象的附近,抓取所述对象,将抓取的对象移动到放置位置并再次释放所述对象。
[0002]在这种操纵的情况下,通常需要遵守多个约束,这些约束可能特别是涉及机器人的运动限制、对象的固定、力限制、距离限制或避免与其他机器人或障碍物发生碰撞。
[0003]迄今为止,这种操纵的规划在许多情况下都是手动进行的。然而,手动规划通常很耗时。此外,通常只能对机器人有限数量的行为方式编程。
[0004]此外,还提供计算机辅助的规划器,所述规划器允许自动规划机器人操纵。在这种规划的范围中,通常从操纵的任务描述和在此过程中要遵守的约束出发,为所述操纵确定满足所述约束的一个或多个轨迹。然后机器人可以执行所确定的轨迹。然而,在许多情况下,这样的轨迹不适合反应式的,即受控的实施。因此,在实际操纵偏离所确定的轨迹的情况下,机器人通常不能以受控方式作出反应。
[0005]Philipp S. Schmitt等人在文献“Modeling and Planning Manipulation in Dynamic Environments(动态环境中的建模和规划操纵)”,Int. Conf. on Robotics and Automation,IEEE,2019,在线预印http://ais.informatik.uni

freiburg.de/publications/papers/schmitt19icra.pdf(于2019年7月10日检索到)中公开了一种方法,通过该方法可以生成所谓的基于约束的调节器,用于在预给定的约束下受控地执行操纵。然而,以这种方式生成的许多调节器可能会在形状不利的障碍物那里受挫。下文以[1]指代上述文献。

技术实现思路

[0006]本专利技术的任务是实现用于通过机器人操纵对象的方法和操纵系统,它们允许以受控和灵活的方式绕过障碍物。
[0007]该任务通过具有权利要求1的特征的方法、通过具有权利要求12的特征的操纵系统、通过具有权利要求13的特征的计算机程序产品以及通过具有权利要求14的特征的计算机可读存储介质来解决。
[0008]为了通过机器人操纵对象,其中所述操纵针对操纵目标并且包括不同的操纵模式,生成多个操纵模式特定的调节器,每个调节器用于调节限于一个操纵模式的子操纵。在此,所述机器人可以特别是工业机器人、服务机器人、运输机器人、门式机器人、所谓的龙门架或用于操纵对象的其他操纵系统。根据本专利技术,针对多个操纵状态和多个生成的调节器,分别模拟从相应的操纵状态出发并由相应生成的调节器调节的子操纵,其中确定对达到所述操纵目标进行量化的耗费值。基于所述多个操纵状态、所述多个生成的调节器以及所述
耗费值,训练机器学习模块以基于操纵状态确定所述生成的调节器中优化耗费值的调节器。在此,优化也应理解为接近最优。此外,以传感器方式检测当前操纵状态,基于该当前操纵状态由经过训练的机器学习模块确定优化耗费的调节器。借助于优化耗费的调节器,基于当前操纵状态生成用于操控机器人的控制数据。
[0009]为了执行根据本专利技术的方法,提供了一种操纵系统、一种计算机程序产品以及一种计算机可读的、优选为非易失性的存储介质。
[0010]根据本专利技术的方法、根据本专利技术的操纵系统以及根据本专利技术的计算机程序产品可以例如借助于一个或多个处理器、一个或多个计算机、专用集成电路(ASIC)、数字信号处理器(DSP)和/或所谓的“现场可编程门阵列”(FPGA)来执行或实现。
[0011]本专利技术的优点特别是在于,允许对复杂的操纵进行反应性和鲁棒的控制。由于考虑了多个操纵状态和调节变量,在许多情况下可以成功地对绕过复杂障碍物进行训练。由于经过训练的机器学习模块的应用通常需要比所述机器学习模块的训练明显更低的计算耗费,因此通常可以实时确定在当前操纵状态下的优化耗费的调节器。
[0012]本专利技术的有利实施方式和扩展在从属权利要求中加以说明。
[0013]根据本专利技术的有利实施方式,所述操纵的状态空间可以包括机器人的配置、机器人状态、对象状态、机器人与对象之间的接触状态、时间参数、时间导数和/或参与操纵的其他组件的状态。特别地,机器人的配置空间可以是所述状态空间的子空间。
[0014]此外,可以检测在操纵期间要遵守的不同约束。然后可以从由相应约束引起的状态空间限制中导出相应的操纵模式。特别地,状态空间的这种限制可以通过所涉及的操纵模式指定、定义和/或表示。状态空间的限制可以分别形成状态空间中的超曲面或由超曲面界定的状态空间子集。相应的约束特别也可以是多维的,即涉及多个操纵参数。为基于约束的操纵模式生成的调节器通常也称为基于约束的调节器(constraint

based controller)。由于这种基于约束的调节器分别调节限于一个操纵模式并因此至少近似地遵守相应约束的子操纵,因此不必再在随后跨操纵模式的优化中明确地考虑这些约束。由此,在许多情况下可以显著降低优化耗费。
[0015]相应的约束可以特别是涉及对象的固定、机器人轴的运动限制、碰撞避免、速度限制、加速度限制、力限制和/或距离限制。特别地,相应的约束可能由机器人运动和/或抓取过程的动力学或动态学引起。
[0016]此外可以规定,生成用于调节以下子操纵的操纵模式特定的调节器,该子操纵限于第一操纵模式并且导致第二操纵模式。这样的调节器通常也被称为模式切换调节器并且使得能够在不同的操纵模式之间进行切换。
[0017]此外可以规定,在操纵模式内选择子操纵目标,并且生成用于调节以下子操纵的操纵模式特定的调节器,该子操纵限于所述操纵模式并导致所述子操纵目标。优选地,可以随机地选择所述子操纵目标。这种调节器通常也称为随机目标调节器。借助于这样的随机目标调节器,在很多情况下可以有效地找到以受控方式绕过障碍物的路径。
[0018]根据本专利技术的一种有利实施方式,可以随机地生成所述多个操纵状态,和/或可以随机地选择所述多个生成的调节器。这也可以有效地有助于找到以受控方式绕过障碍物的路径。
[0019]此外,可以根据直到达到所述操纵目标为止的模拟的持续时间和/或模拟的控制
步骤的数量来确定所述耗费值。
[0020]根据本专利技术的另一有利实施方式,可以针对生成的调节器的多个序列分别模拟由相应序列调节的操纵,其中确定对达到所述操纵目标进行量化的耗费值。然后可以基于所确定的耗费值来进行机器学习模块的训练。针对调节器序列,特别是可以模拟地检查所述调节器序列是否导致所述操纵目标。
附图说明
[0021]下面基于附图更详细地解释本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于通过机器人(R)操纵对象(OB)的方法,其中所述操纵针对操纵目标(MT)并且包括不同的操纵模式(M1,M2,M3),其中a)生成多个操纵模式特定的调节器(R1,

,R4),每个调节器都用于调节限于一个操纵模式(M1,M2,M3)的子操纵,b)针对多个操纵状态(MZ)和多个生成的调节器(RS),分别模拟从相应的操纵状态(MZ)出发并由相应的生成的调节器调节的子操纵,其中确定对达到所述操纵目标(MT)进行量化的耗费值(AW),c)基于所述多个操纵状态(MZ)、所述多个生成的调节器(RS)以及所述耗费值(AW),训练机器学习模块(NN)以基于操纵状态确定所述生成的调节器中优化耗费值的调节器,d)以传感器方式检测当前操纵状态(AMZ),e)基于所述当前操纵状态(AMZ)由经过训练的机器学习模块(NN)确定优化耗费的调节器(OR),以及f)借助于所述优化耗费的调节器(OR),基于所述当前操纵状态(AMZ)生成用于操控所述机器人(R)的控制数据(CD)。2.如权利要求1所述的方法,其特征在于,所述操纵的状态空间包括所述机器人(R)的配置、机器人状态、对象状态、机器人与对象之间的接触状态、时间参数、时间导数和/或参与所述操纵的其他组件的状态。3.如权利要求2所述的方法,其特征在于,检测在所述操纵期间要遵守的不同约束(NB),以及从由相应约束(NB)引起的状态空间限制中导出相应的操纵模式(M1,M2,M3)。4.如权利要求3所述的方法,其特征在于,相应的约束(NB)涉及所述对象(OB)的固定、所述机器人(R)的轴的运动限制、碰撞避免、速度限制、加速度限制、力限制和/或距离限制。5.如前述权利要求中任一项所述的方法,其特征在于,生成用于调节以下子操纵的操纵模式特定的调节...

【专利技术属性】
技术研发人员:P
申请(专利权)人:西门子股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1