【技术实现步骤摘要】
用于控制机器人装置的设备和方法
[0001]总的来说,各种实施例涉及一种用于控制机器人装置的设备和方法。
技术介绍
[0002]机器人装置例如可以在制造中、在生产中、在维修中、在家庭中、在医疗技术等等中使用。在这种情况下,这些机器人装置例如可以拿起和移动对象。在此,机器人控制模型可以确定机器人装置如何拿起和移动对象(例如在使用一个或多个机器人臂的情况下)。但是,这可能取决于位于所要拿起的对象附近的其它对象并且取决于机器人装置的几何配置。例如,有对象可能阻碍机器人臂的轨迹。因而,可能必要的是:机器人控制模型为所要拿起的(并且可选地还要移动的)对象确定控制指令,使得不仅其它对象被考虑而且机器人装置的几何条件被考虑。
[0003]J. Mahler等人于2019年在Science Robotics期刊发表的出版物“Learning ambidextrous robot grasping policies”(在下文称为参考文献[1])描述了一种模型(Dexterity Network(灵巧网络,Dex
‑
N ...
【技术保护点】
【技术特征摘要】
1.一种用于利用控制模型来控制机器人装置的方法,所述控制模型被设立用于控制所述机器人装置来拿起对象,其中所述控制模型具有机器人轨迹模型、先决条件模型和对象拿起模型,其中为了所述拿起,所述机器人轨迹模型具有隐式半马尔可夫模型,所述隐式半马尔可夫模型具有一个或多个初始状态和一个或多个最终状态,其中所述先决条件模型针对所述机器人轨迹模型的每个初始状态都具有在实施所述拿起之前的机器人配置的概率分布,其中所述对象拿起模型作为对深度图像的输入的反应来输出具有相应所分配的成功概率的多个拿起机器人配置,所述方法具有:
•ꢀ
确定显示出一个或多个对象的深度图像;
•ꢀ
针对所述一个或多个对象中的至少一个所要移动的对象,在使用所述深度图像的情况下,借助于所述对象拿起模型来确定具有高于预先限定的阈值的成功概率的一个或多个拿起机器人配置;
•ꢀ
按照所述先决条件模型针对所述一个或多个拿起机器人配置中的具有最高概率的拿起机器人配置,借助于所述机器人轨迹模型来确定用于所述拿起的机器人轨迹;而且
•ꢀ
借助于所确定的机器人轨迹来控制所述机器人装置实施对所述对象的拿起。2.根据权利要求1所述的方法,其中所述机器人轨迹模型和所述先决条件模型在使用用于执行对对象的拿起的演示的情况下被训练。3.根据权利要求1或2中任一项所述的方法,其中所述对象拿起模型在使用多个训练深度图像的情况下被训练,其中每个训练深度图像都显示出多个对象中的至少一个对象,所述训练具有:
•ꢀ
针对所述多个训练深度图像中的每个训练深度图像,模拟对至少一个对象的多次拿起,并且确定对所述至少一个对象的相应的拿起是否成功,作为奖励,其中对所述至少一个对象的每次拿起都被分配给相应的拿起机器人配置;
•ꢀ
在使用所述多个训练深度图像、所述奖励和所述拿起机器人配置的情况下训练所述对象拿起模型,使得经训练的对象拿起模型作为对深度图像的输入的反应输出具有相应所分配的成功概率的多个拿起机器人配置。4.根据权利要求3所述的方法,其中对对象的每次拿起都在使用所述机器人轨迹模型和所述先决条件模型的情况下被模拟。5.根据权利要求1至4中任一项所述的方法,所述方法还具有:
•ꢀ
确定所述机器人装置是否成功实施对所述对象的拿起,其中如果对所述拿起的实施成功,则确定预先给定的最大奖励,而且其中如果对所述拿起的实施不成功,则确定预先给定的最小奖励;
•ꢀ
在使用所确定的深度图像、针对其确定所述机器人轨迹的拿起机器人配置和所确定的奖励的情况下附加地训练所述对象拿起模型。6.根据权利要求1至5中任一项所述的方法,其中所述控制模型还被设立用于控制所述机器人装置来移动所拿起的对象,其中为了所述移动,所述机器人轨迹模型具有隐式半马尔可夫模型,所述隐式半马尔可夫模型具有一个或多个初始状态和一个或多个最终状态,
其中所述先决条件模型针对被分配给所述移动的机器人轨迹模型的每个初始状态都具有在实施所述移动之前的机器人配置的概率分布,其中所述控制模型还具有终止条件模型,其中所述终止条件模型针对被分配给所述拿起的机器人轨迹模型的每个最终状态都具有在实施所述拿起之后的机器人配置的概率分布,而且针对被分配给所述移动的机器人轨迹模型的每个最终状态都具有在实施所述移动之后的机器人配置的概率分布,其中所述方法还具有:
•ꢀ
按照所述终止条件模型来确定在实施对所述对象的拿起之后的机器人配置;
•ꢀ
借助于所述机器人轨迹模型来确定用于对所述对象的移动的机器人轨迹;
•ꢀ
借助于所确定的机器人轨迹来控制所述机器人装置实施对所述对象的移动。7.根据权利要求6所述的方法,其中所述机器人轨迹模型、所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。