【技术实现步骤摘要】
机器人动作控制方法、机器人动作控制装置、介质及设备
[0001]本申请涉及机器人控制
,具体而言,涉及一种机器人动作控制方法、机器人动作控制装置、计算机可读存储介质及电子设备。
技术介绍
[0002]对于一些紧急救援任务来说,可能不便通过人力执行救援任务,如,月球上的救援任务。此时,可能需要通过机器人来执行此类救援任务。在通过机器人执行救援任务时,通常需要面对如下问题:如何通过最优的动作选择,来控制机器人高效完成救援任务。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有方案的信息。
技术实现思路
[0004]本申请的目的在于提供一种机器人动作控制方法、机器人动作控制装置、计算机可读存储介质及电子设备,可以基于位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,从而得到动作集合,机器人执行动作集合中的动作可以到达需要救援的位置,从而完成救援任务,本申请中,可以依据各动作集合对应的激励值选取最优的目标动作 ...
【技术保护点】
【技术特征摘要】
1.一种机器人动作控制方法,其特征在于,包括:确定目标救援对象在地形图中的位置;基于所述位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合;根据各动作集合对应的激励值选取目标动作集合;控制机器人团队中各机器人按照时序执行所述目标动作集合中各自对应的动作,以到达所述目标救援对象的位置。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述机器人团队中各类型机器人的动作总数量以及执行动作所需时长计算总时间衡量函数,并根据所述总时间衡量函数计算所述总时间消耗激励值;根据所述机器人团队中操作机器人在最终时刻与所述目标救援对象的相对距离计算相对距离激励值;根据所述机器人团队对应的位置确定目的地抵达激励值;根据各时刻机器人动作计算分步激励值;根据所述总时间消耗激励值、所述相对距离激励值、所述目的地抵达激励值、所述分步激励值生成所述各动作集合对应的激励值。3.根据权利要求1所述的方法,其特征在于,其中:所述机器人团队中各类型机器人对应于不同的属性,属性包括感知能力、各类型区域的通过性、运动范围、运动速度。4.根据权利要求3所述的方法,其特征在于,基于所述位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合,包括:通过强化学习算法,并基于所述位置、当前时刻对应的机器人动作、各类型机器人的属性,生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合。5.根据权利要求1所述的方法,其特征在于,确定目标...
【专利技术属性】
技术研发人员:郑子轩,宋婷,袁建平,梁启明,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。