控制载具的方法和用于控制载具的装置制造方法及图纸

技术编号:26374627 阅读:22 留言:0更新日期:2020-11-19 23:43
控制载具的方法和用于控制载具的装置。一种控制载具或机器人的方法,其中所述方法包括以下步骤:确定第一控制序列,取决于所述第一控制序列、所述载具或机器人的当前状态以及对所述载具或机器人的动态行为进行表征的模型来确定用于控制所述载具或机器人的第二控制序列,取决于所述第二控制序列来控制所述载具或机器人,其中所述第一控制序列的所述确定取决于第一候选控制序列和第二候选控制序列来被执行。

【技术实现步骤摘要】
控制载具的方法和用于控制载具的装置
示例性的实施例涉及一种控制载具或机器人的方法,其中所述方法包括以下步骤:确定用于控制所述载具或机器人的第一控制序列,取决于所述第一控制序列、所述载具或机器人的当前状态、以及对所述载具或机器人的动态行为进行表征的模型来确定用于控制所述载具或机器人的第二控制序列,取决于所述第二控制序列来控制所述载具或机器人。另外的示例性实施例涉及一种用于控制载具或机器人的装置。另外的示例性实施例涉及一种训练条件变分自动编码器CVAE的方法、特别是经计算机实现的方法。一种控制具有先前提及的类型的载具的方法由Williams,G.,Wagener,N.,Goldfain,B.,Drews,P.,Rehg,J.M.,Boots,B.,&Theodorou,E.A.(2017年5月)的“Informationtheoreticmpcformodel-basedreinforcementlearning”(于InternationalConferenceonRoboticsandAutomation(关于机器人学和自动化的国际本文档来自技高网...

【技术保护点】
1.一种控制载具(100;100’)或机器人的方法,其中所述方法包括以下步骤:确定(300)第一控制序列(cs1),取决于所述第一控制序列(cs1)、所述载具(100;100’)或机器人的当前状态(cst)以及对所述载具(100;100’)或机器人的动态行为进行表征的模型(M)来确定(310)用于控制所述载具(100;100’)的第二控制序列(cs2),取决于所述第二控制序列(cs2)来控制(320)所述载具(100;100’)或机器人,其中所述第一控制序列(cs1)的所述确定(300)包括:提供(301)第一候选控制序列(ccs1),确定(302)与所述第一候选控制序列(ccs1)相关联的第...

【技术特征摘要】
20190514 EP 19174326.91.一种控制载具(100;100’)或机器人的方法,其中所述方法包括以下步骤:确定(300)第一控制序列(cs1),取决于所述第一控制序列(cs1)、所述载具(100;100’)或机器人的当前状态(cst)以及对所述载具(100;100’)或机器人的动态行为进行表征的模型(M)来确定(310)用于控制所述载具(100;100’)的第二控制序列(cs2),取决于所述第二控制序列(cs2)来控制(320)所述载具(100;100’)或机器人,其中所述第一控制序列(cs1)的所述确定(300)包括:提供(301)第一候选控制序列(ccs1),确定(302)与所述第一候选控制序列(ccs1)相关联的第一累积轨迹成本(atc1),提供(303)第二候选控制序列(ccs2),确定(304)与所述第二候选控制序列(ccs2)相关联的第二累积轨迹成本(atc2),比较(305)所述第一累积轨迹成本(atc1)与所述第二累积轨迹成本(atc2),以及取决于所述比较(305),使用(306)所述第一候选控制序列(ccs1)作为所述第一控制序列(cs1)或者使用(307)所述第一候选控制序列(ccs1)和所述第二候选控制序列(ccs2)的经加权的总和(ws)作为所述第一控制序列(cs1)。


2.根据权利要求1所述的方法,其中根据等式来确定所述经加权的总和(ws),其中表示所述第一候选控制序列(ccs1),其中表示所述第二候选控制序列(ccs2),其中表示所述第一累积轨迹成本(atc1),其中表示所述第二累积轨迹成本(atc2),并且其中表示所述经加权的总和(ws)。


3.根据前述权利要求中至少一项所述的方法,其中一个或多个控制循环(cc)用于控制所述载具(100;100’)或机器人,其中所述控制循环(cc)中的至少一个、优选所有控制循环(cc)包括确定(300)第一控制序列(cs1)、确定(310)第二控制序列(cs2)以及取决于所述第二控制序列(cs2)来控制(320)所述载具(100;100’)或机器人的所述步骤,其中提供(301)所述第一候选控制序列(ccs1)的所述步骤包括使用初始控制序列(ics)作为所述第一候选控制序列(ccs1),或者基于在前控制循环(cc)的第二控制序列(cs2)来确定所述第一候选控制序列(ccs1)。


4.根据所述前述权利要求中至少一项所述的方法,其中提供(303)所述第二候选控制序列(ccs2)的所述步骤包括使用所训练的第一神经网络(NN1),所述所训练的第一神经网络(NN1)被配置成接收第一输入参数(ip1)以及取决于所述第一输入参数(ip1)来输出所述第二候选控制序列(ccs2)。


5.根据权利要求4所述的方法,其中所述第一神经网络(NN1)是条件变分自动编码器CVAE(400)的解码器(402),其中所述CVAE(400)此外包括编码器(401),所述编码器(401)包括第二神经网络(NN2),其中所述编码器(401)被配置成接收第二输入参数(ip2),所述第二输入参数(ip2)表征所述载具(100;100’)或机器人的潜在轨迹和/或针对所述载具(100;100’)或机器人的条件,并且将所述第二输入参数(ip2)映射到隐空间中具有均值µ和方差∑的正态分布,其中表示所述载具(100;100’)或机器人的所述潜在轨迹,并且其中表示针对所述载具(100;100’)或机器人的所述条件。


6.根据权利要求4至5中至少一项所述的方法,其中所述第一神经网络(NN1)和/或所述第二神经网络(NN2)包括a)四层,优选地四个全连接的层,和/或b)修正线性单元ReLU,其用于实现激活函数。


7.根据权利要求5至6中至少一项所述的方法,此外包括:通过应用以下各项中的至少一个来训练(10)所述CVAE(400):a)域特定的损失函数,其取决于所述载具(100;100’)的所述潜在轨迹和/或针对所述载具(100;100’)或机器人的所述条件,b)在所述隐空间中的Kullback-Leibler、KL-发散,其特别地根据,其中是结果得到的损失函数,其中是所述隐空间中的所述Kullback-Leibler发散,其中是所述正态分布,并且其中表征所期望的隐空间分布。


8.根据权利要求...

【专利技术属性】
技术研发人员:KO阿拉斯L帕尔米耶里M斯皮斯RKB德阿尔梅达
申请(专利权)人:罗伯特·博世有限公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1