本申请提供一种机器人动作控制方法、机器人动作控制装置、计算机可读存储介质及电子设备,涉及机器人控制技术领域,该方法可以确定目标救援对象在地形图中的位置,基于位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,从而得到动作集合,机器人执行动作集合中的动作可以到达需要救援的位置,从而完成救援任务,本申请中,可以依据各动作集合对应的激励值选取最优的目标动作集合,机器人团队中的机器人执行目标动作集合中的动作可以更高效地完成救援任务,这样有利于提升救援效率。效率。效率。
【技术实现步骤摘要】
机器人动作控制方法、机器人动作控制装置、介质及设备
[0001]本申请涉及机器人控制
,具体而言,涉及一种机器人动作控制方法、机器人动作控制装置、计算机可读存储介质及电子设备。
技术介绍
[0002]对于一些紧急救援任务来说,可能不便通过人力执行救援任务,如,月球上的救援任务。此时,可能需要通过机器人来执行此类救援任务。在通过机器人执行救援任务时,通常需要面对如下问题:如何通过最优的动作选择,来控制机器人高效完成救援任务。
[0003]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有方案的信息。
技术实现思路
[0004]本申请的目的在于提供一种机器人动作控制方法、机器人动作控制装置、计算机可读存储介质及电子设备,可以基于位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,从而得到动作集合,机器人执行动作集合中的动作可以到达需要救援的位置,从而完成救援任务,本申请中,可以依据各动作集合对应的激励值选取最优的目标动作集合,机器人团队中的机器人执行目标动作集合中的动作可以更高效地完成救援任务,这样有利于提升救援效率。
[0005]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0006]根据本申请的一方面,提供一种机器人动作控制方法,该方法包括:
[0007]确定目标救援对象在地形图中的位置;
[0008]基于位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合;
[0009]根据各动作集合对应的激励值选取目标动作集合;
[0010]控制机器人团队中各机器人按照时序执行目标动作集合中各自对应的动作,以到达目标救援对象的位置。
[0011]在本申请的一种示例性实施例中,方法还包括:
[0012]基于机器人团队中各类型机器人的动作总数量以及执行动作所需时长计算总时间衡量函数,并根据总时间衡量函数计算总时间消耗激励值;
[0013]根据机器人团队中操作机器人在最终时刻与目标救援对象的相对距离计算相对距离激励值;
[0014]根据机器人团队对应的位置确定目的地抵达激励值;
[0015]根据各时刻机器人动作计算分步激励值;
[0016]根据总时间消耗激励值、相对距离激励值、目的地抵达激励值、分步激励值生成各动作集合对应的激励值。
[0017]在本申请的一种示例性实施例中,机器人团队中各类型机器人对应于不同的属性,属性包括感知能力、各类型区域的通过性、运动范围、运动速度。
[0018]在本申请的一种示例性实施例中,基于位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合,包括:
[0019]通过强化学习算法,并基于位置、当前时刻对应的机器人动作、各类型机器人的属性,生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合。
[0020]在本申请的一种示例性实施例中,确定目标救援对象在地形图中的位置,包括:
[0021]依据预设划分规则将地形图划分为网格图;
[0022]确定目标救援对象在网格图中的位置。
[0023]在本申请的一种示例性实施例中,目标动作集合包括多个时刻对应的子动作集合,子动作集合中包括各机器人对应的待执行动作。
[0024]在本申请的一种示例性实施例中,机器人团队中包括第一预设数量的中枢机器人、第二预设数量的运输机器人、第三预设数量的操作机器人,其中,中枢机器人用于指挥运输机器人和操作机器人,运输机器人用于运送操作机器人,操作机器人用于执行特定操作。
[0025]根据本申请的一方面,提供一种机器人动作控制装置,包括:
[0026]位置确定单元,用于确定目标救援对象在地形图中的位置;
[0027]动作集合生成单元,用于基于位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合;
[0028]动作集合选取单元,用于根据各动作集合对应的激励值选取目标动作集合;
[0029]机器人控制单元,用于控制机器人团队中各机器人按照时序执行目标动作集合中各自对应的动作,以到达目标救援对象的位置。
[0030]在本申请的一种示例性实施例中,装置还包括:
[0031]参数计算单元,用于基于机器人团队中各类型机器人的动作总数量以及执行动作所需时长计算总时间衡量函数,并根据总时间衡量函数计算总时间消耗激励值;根据机器人团队中操作机器人在最终时刻与目标救援对象的相对距离计算相对距离激励值;根据机器人团队对应的位置确定目的地抵达激励值;根据各时刻机器人动作计算分步激励值;根据总时间消耗激励值、相对距离激励值、目的地抵达激励值、分步激励值生成各动作集合对应的激励值。
[0032]在本申请的一种示例性实施例中,机器人团队中各类型机器人对应于不同的属性,属性包括感知能力、各类型区域的通过性、运动范围、运动速度。
[0033]在本申请的一种示例性实施例中,动作集合生成单元基于位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合,包括:
[0034]通过强化学习算法,并基于位置、当前时刻对应的机器人动作、各类型机器人的属性,生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合。
[0035]在本申请的一种示例性实施例中,位置确定单元确定目标救援对象在地形图中的位置,包括:
[0036]依据预设划分规则将地形图划分为网格图;
[0037]确定目标救援对象在网格图中的位置。
[0038]在本申请的一种示例性实施例中,目标动作集合包括多个时刻对应的子动作集合,子动作集合中包括各机器人对应的待执行动作。
[0039]在本申请的一种示例性实施例中,机器人团队中包括第一预设数量的中枢机器人、第二预设数量的运输机器人、第三预设数量的操作机器人,其中,中枢机器人用于指挥运输机器人和操作机器人,运输机器人用于运送操作机器人,操作机器人用于执行特定操作。
[0040]根据本申请的一方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的方法。
[0041]根据本申请的一方面,提供一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的方法。
[0042]本申请示例性实施例可以具有以下部分或全部有益效果:
[0043]在本申请的一示例实施方式所提供的机器人动作控制方法中,可以确定目标救援对象在地形图中的位置;基于位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合;根据各动作集合对应的激励值选本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种机器人动作控制方法,其特征在于,包括:确定目标救援对象在地形图中的位置;基于所述位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合;根据各动作集合对应的激励值选取目标动作集合;控制机器人团队中各机器人按照时序执行所述目标动作集合中各自对应的动作,以到达所述目标救援对象的位置。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于所述机器人团队中各类型机器人的动作总数量以及执行动作所需时长计算总时间衡量函数,并根据所述总时间衡量函数计算所述总时间消耗激励值;根据所述机器人团队中操作机器人在最终时刻与所述目标救援对象的相对距离计算相对距离激励值;根据所述机器人团队对应的位置确定目的地抵达激励值;根据各时刻机器人动作计算分步激励值;根据所述总时间消耗激励值、所述相对距离激励值、所述目的地抵达激励值、所述分步激励值生成所述各动作集合对应的激励值。3.根据权利要求1所述的方法,其特征在于,其中:所述机器人团队中各类型机器人对应于不同的属性,属性包括感知能力、各类型区域的通过性、运动范围、运动速度。4.根据权利要求3所述的方法,其特征在于,基于所述位置和当前时刻对应的机器人动作生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合,包括:通过强化学习算法,并基于所述位置、当前时刻对应的机器人动作、各类型机器人的属性,生成下个时刻对应的机器人动作,以获取对应于各时刻机器人动作的动作集合。5.根据权利要求1所述的方法,其特征在于,确定目标...
【专利技术属性】
技术研发人员:郑子轩,宋婷,袁建平,梁启明,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。