【技术实现步骤摘要】
用于支持运输工具或机器人的机动动作规划的方法和设备
[0001]本专利技术涉及一种用于支持至少部分自动驾驶的运输工具或机器人的机动动作规划(Man
ö
verplanung)的方法和设备。本专利技术此外涉及控制设备、运输工具和机器人。
技术介绍
[0002]在自动驾驶运输工具中,除了轨迹规划、也即提供在当前情形下具体要行驶的轨迹以外在机动动作规划的范畴内还需要有策略的机动动作规划,以便实现上级策略。对此的具体示例是具有多条车道和许多其他交通参与者的转弯情形。于是必须判定运输工具何时必须在哪个行车道上,以便例如对于乘客而言尽可能舒适地和/或尽可能时间优化地来执行转弯过程,并且判定为此必须超越哪些其他交通参与者。对于自动行动机器人,也得出从原则上相同的问题情况。
[0003]如下强化学习方法是已知的,其中借助于所述强化学习方法可以训练(anlernen)其他交通参与者的行为并且可以基于此做出最优决策。在此情况下,在状态和与此相对应的与目标设置相关的最优行动之间学习映射(英语:mapping),所述目标设置 ...
【技术保护点】
【技术特征摘要】
1.一种用于支持至少部分自动驾驶的运输工具(50)或机器人的机动动作规划的方法,其中借助于行动确定装置(2),借助于马尔可夫决策问题以离散形式描述所述运输工具(50)或机器人的环境的状态空间(10),其中为了支持所述运输工具(50)或机器人的机动动作规划,基于马尔可夫决策问题通过执行至少一个优化方法基于所述状态空间(10)中的离散状态(11)确定最优行动,其中确定具有状态空间(10)中的状态(11)作为输入值和具有状态空间(10)中的最优行动(34)作为输出值的映射(30),其中借助于逼近装置(3)通过函数逼近对所确定的所述映射(30)进行逼近,其中如下经逼近的映射(31)的元素根据分别所属的输入值而被存储在查找表(33)中,所述经逼近的映射的输出值相对于所述所确定的映射(30)的相应输出值而言具有超过预给定误差阈值(32)的误差,并且其中所述经逼近的映射(31)和所述查找表(33)被提供用于在机动动作规划时使用。2.根据权利要求1所述的方法,其特征在于,所述提供包括:将所述经逼近的映射(31)和所述查找表(33)加载到至少一个运输工具(50)或至少一个机器人的控制设备(51)的存储器中,使得在运行所述至少一个运输工具(50)或所述至少一个机器人时为了提供针对状态空间(10)的所识别的离散状态(11)的最优行动(34)而能够借助于所述控制设备(51)首先检验:对于所识别的状态(11)在所述查找表(33)中是否存放有最优行动(34);如果这是该情况,则所存放的最优行动(34)能够被调用并且被提供用于机动动作规划,否则所述最优行动(34)能够借助于所述经逼近的映射(31)被估计并且被提供用于机动动作规划。3.根据权利要求1或2所述的方法,其特征在于,为了对所述映射(30)进行函数逼近而训练和提供至少一个神经网络。4.根据前述权利要求中任一项所述的方法,其特征在于,借助于后端服务器(100)执行:提供所述经逼近的映射(31)和所述查找表(33)。5.一种用于支持至少部分自动驾驶的运输工具(50)或机器人的机动动作规划的方法,其中借助于所述运输工具(50)或机器人的控制设备(51)获得和/或提供按照根据权利要求1至4中任一项所述的方法生成的经逼近的映射(31)和查找表(33),并且根据状态空间(10)的所识别的离散状态(11)提供最优行动(34)用于机动动作规划,其中在此情况下首先检验:对于所识别的状态(11)在所述查找表(33)中是否存...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。