当前位置: 首页 > 专利查询>罗伯特专利>正文

用于控制机器人设备的方法技术

技术编号:38423646 阅读:11 留言:0更新日期:2023-08-07 11:22
用于控制机器人设备的方法。按照各种实施方式,描述了一种用于控制机器人设备的方法,所述方法具有:产生用于执行任务的机器人控制模型,其中所述机器人控制模型具有影响所述任务的执行的参数;借助于对目标函数的优化来调整所述机器人控制模型的参数,所述目标函数评估在执行所述任务时在至少一个连续传感器信号的时间变化过程方面是否符合至少一个条件;而且按照所述机器人控制模型来控制所述机器人设备,以利用经过调整的参数来执行所述任务。务。务。

【技术实现步骤摘要】
用于控制机器人设备的方法


[0001]本公开涉及用于控制机器人设备的方法。

技术介绍

[0002]在机器人的执行(对象的)操纵的任务中,核心问题在于为相应的任务确定适合的(例如机器人臂的)轨迹。存在多种不同的方案,这些方案全部都具有不同特征,以便尽可能高效地解决特定任务类型。一个示例是示教学习(LfD,英文为learning from demonstration)。
[0003]在LfD的情况下,人类用户(“专家”)向机器人演示所意图的行为,即旨在解决特定任务的示例性轨迹。机器人从这些演示中学习机器人控制模型,并且从而拥有相对应的运动技能。例如参见Rozo,L.,Guo,M.,Kupcsik,A.G.,Todescato,M.,Schillinger,P.,Giftthaler,M.,...和Burger,M.“Learning and sequencing of object

centric manipulation skillsfor industrial tasks”in2020IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS)(9072

9079页)。IEEE,在下文称为参考文献[1],以了解基于所演示的技能的机器人支持的组装的更多细节。
[0004]当用于所希望的轨迹的标准难以明确描述时,LfD方法特别适用。然而,该方案只能够检测隐式标准,并且不存在用于添加其它明确的限制或者所希望的特性的通用机制。
[0005]为了解决这些限制,这些明确的条件可以以单独的形式来表达并且然后使用优化技术,以便改进最初学习的运动技能。例如,在Innes,C.和Ramamoorthy,S.的“Elaborating on learned demonstrations with temporal logic specifications”,2020,arXiv preprint arXiv:2002.00784中,在下文称为参考文献[2],目标以线性时间逻辑(LTL代表英文Linear Temporal Logic(线性时态逻辑))、即时态(时间)逻辑的变体来表述,以便优化动态运动基元(DMP代表英文Dynamic Movement Primitives(动态运动基元))、即LfD的动态系统变体。
[0006]Dhonthi,A.,Schillinger,P.,Rozo,L.和Nardi,D.的论文(2021年)“Study of Signal Temporal Logic Robustness Metrics for Robotic Tasks Optimization”,arXiv preprint arXiv:2110.00339,在下文称为参考文献[3],还描述了借助于STL(Signal Temporal Logic(信号时态逻辑))对条件的表述。
[0007]参考文献[2]的做法需要确定梯度,并且因此可被规定的显式条件的范围有限。
[0008]因此,值得期望的是能够在更大范围内规定显式条件的做法。

技术实现思路

[0009]按照各种实施方式,提供了一种用于控制机器人设备的方法,该方法具有:产生用于执行任务的机器人控制模型,其中该机器人控制模型具有影响任务的执行的参数;借助于对目标函数的优化来调整该机器人控制模型的参数,该目标函数评估在执行该任务时在至少一个连续传感器信号的时间变化过程方面是否符合至少一个条件;并且按照该机器人
控制模型来控制该机器人设备,以利用经过调整的参数来执行该任务。
[0010]例如借助于黑盒优化(Black

Box

Optimierung)来进行对该目标函数的优化。黑盒优化(BBO)的使用消除了例如在参考文献[2]的方法中所需的梯度的必要性,并且因此能够通过更广泛的并且更有意义的信号范围来定义条件(例如借助于信号时态逻辑(STL)),例如对合力的限制的说明或者通常是轨迹的影响而不是该轨迹本身。因此,利用上述方法可以涵盖更广泛的应用。
[0011]在BBO的情况下,可以针对各种场景来执行该任务或者针对该目标函数的每次评估来使用同一场景(即例如对象始终处在相同位置)。尽可能保持场景相同以便使未知影响最小化可以有用。如果实际可行的话,针对每个参数集执行不同场景的集合并且通过执行来求平均值同样可以有用。从实际角度来看,也许可能无法准确重复场景,但是这也不是BBO的排除标准,而只可能会导致更差的结果或者更缓慢的优化。
[0012]上述机器人控制方法例如可以被用于机器人操纵任务,在这些机器人操纵任务中,专家规定或指定机器人的所希望的行为。尤其对于受机器人支持的组装来说情况如此,在这种情况下,某些组装步骤需要复杂的运动并且同时必须满足附加条件。例如,在组装过程中,必须将榫头以特定方式插入另一工件。人类可以演示该运动,原因在于可能会难以完全正式地描述该运动,但是仍然值得期望的是:实现某些限制、如接触力的降低或者目标位置精度,这些限制可能次优地被演示。
[0013]在下文说明了各种实施例。
[0014]实施例1是用于控制机器人设备的方法,如上所述。
[0015]实施例2是根据实施例1所述的方法,该方法还具有:按照时间信号逻辑以至少一个时间信号逻辑公式来表示该至少一个条件;将该至少一个时间信号逻辑公式转换成至少一个鲁棒性量度;并且通过确定该至少一个鲁棒性量度的值来评估该目标函数以执行该任务。
[0016]使用时间信号逻辑(STL代表英文Signal Temporal Logic)来检测条件,能够实现对条件的有意义的规范,例如通过为时间操作符指定时间间隔的可能性。换言之,该至少一个条件借助于一个或多个时间间隔和一个或多个连续信号来被表示。存在用于将STL公式转换成实值奖励函数、即所谓的鲁棒性量度的高效方法,这些鲁棒性量度能够基于其数学特性来实现对机器人控制模型的有意义的优化。
[0017]实施例3是根据实施例1或2所述的方法,其中该机器人控制模型的参数具有时间相关参数和位置相关参数。
[0018]具有这种参数的机器人控制模型、诸如具有持续时间概率作为时间相关参数以及(例如)平均方位作为位置相关参数的HSMM非常符合使用STL用于条件的规范,原因在于STL对时间和空间条件进行表述。
[0019]实施例4是根据实施例1至3中任一项所述的方法,其中所述机器人控制模型是隐式半马尔可夫模型(HSMM代表英文Hidden Semi Markov Mode;)。
[0020]使用HSMM模型(例如用于LfD)导致为所学习的技能(即用于执行该任务的技能)生成基于状态的离散模型,其中每个状态大致对应于沿着轨迹的概率路标并且转变时长定义了该轨迹的相应部段的执行速度。这为STL条件的规范提供了合理的基础,其方式是在STL目标与能力模型的参数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于控制机器人设备的方法,所述方法具有:产生用于执行任务的机器人控制模型,其中所述机器人控制模型具有影响所述任务的执行的参数;借助于对目标函数的优化来调整所述机器人控制模型的参数,所述目标函数评估在执行所述任务时在至少一个连续传感器信号的时间变化过程方面是否符合至少一个条件;按照所述机器人控制模型来控制所述机器人设备,以利用经过调整的参数来执行所述任务。2.根据权利要求1所述的方法,所述方法还具有:按照时间信号逻辑以至少一个时间信号逻辑公式来表示所述至少一个条件;将所述至少一个时间信号逻辑公式转换成至少一个鲁棒性量度;并且通过确定所述至少一个鲁棒性量度的值来评估所述目标函数以执行所述任务。3.根据权利要求1或2所述的方法,其中所述机器人控制模型的参数具有时间相关...

【专利技术属性】
技术研发人员:P
申请(专利权)人:罗伯特
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1