【技术实现步骤摘要】
本专利技术涉及一种多足机器人的多种步态发现方法,尤其涉及的是资源受限情况下的基于质量-多样性优化的多足机器人多种步态发现方法,属于机器人控制。
技术介绍
1、随着机器人控制、强化学习、计算机视觉等领域的发展,多足机器人在复杂环境中完成人类给定任务的能力越来越强,够辅助甚至替代人类完成困难、危险的任务。例如,在地震灾难救援中,多足机器人可以替代人类在余震频发的地区寻找和救治伤员。在这个过程中,由于环境复杂多变,危险难以预测,机器人在任务执行中可能会遭遇不可逆的损伤。传统机器人控制策略仅能执行单一步态,一旦多足机器人某条足受损,难以维持原本的步态,运动速度大大降低,无法完成任务。为了克服这一问题,现有研究通过离线地发现多足机器人的多种步态,并在复杂环境部署中对对步态进行自动适应,能够在一定程度上解决复杂环境中的机器人控制问题。
2、质量多样性算法(quality-diversity,qd)是演化算法的一个子集,已成为解决这一具有挑战性的任务的典型算法,在许多现实世界任务中有着重要应用,例如机器人控制、策略集成和人机协作。qd算法
...【技术保护点】
1.一种资源受限情况下的多足机器人多种步态发现方法,其特征在于,只保存一个共享的感知模块,具体包括如下步骤:
2.根据权利要求1所述的资源受限情况下的多足机器人多种步态发现方法,其特征在于,对于步骤5,为了解决不匹配问题,定期用最新的共享感知模块重新评估策略集中的所有行动模块,并通过生存选择将它们添加回策略集;在策略集的每个单元中保留K个行动模块,K>1,即维护一个具有K个层级的深度行动模块集其中集合每个单元格的每个层级都存储着一个行动模块,且前进速度随着层级的增加而降低。
3.根据权利要求2所述的资源受限情况下的多足机器人多种步态发现方法,其
...【技术特征摘要】
1.一种资源受限情况下的多足机器人多种步态发现方法,其特征在于,只保存一个共享的感知模块,具体包括如下步骤:
2.根据权利要求1所述的资源受限情况下的多足机器人多种步态发现方法,其特征在于,对于步骤5,为了解决不匹配问题,定期用最新的共享感知模块重新评估策略集中的所有行动模块,并通过生存选择将它们添加回策略集;在策略集的每个单元中保留k个行动模块,k>1,即维护一个具有k个层级的深度行动模块集其中集合每个单元格的每个层级都存储着一个行动模块,且前进速度随着层级的增加而降低。
3.根据权利要求2所述的资源受限情况下的多足机器人多种步态发现方法,其特征在于,通过只重新评估深度行动模块集前k(1≤k≤k)层中的行动模块...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。