一种资源受限情况下的多足机器人多种步态发现方法技术

技术编号：42573762 阅读：21 留言：0更新日期：2024-08-29 00:38

本发明专利技术公开一种资源受限情况下的多足机器人多种步态发现方法，将多组机器人策略网络分解为感知模块和行动模块，所有的步态共享感知模块，为每种步态维护一个能产生该步态的行动模块，使用质量‑多样性算法对上述所有模块进行优化，并通过加深行动模块集、衰减感知模块学习率来解决共享感知模块带来的不匹配问题。相较于现有的多组机器人多种步态发现方法，本发明专利技术具有极高的资源效率，只需要极少的资源就可以获得一组与现有方法相近或更优的多组机器人步态。本发明专利技术易于实现，可以被方便地用于各种多足机器人的多种步态发现问题中，具有较大的实际应用潜力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种多足机器人的多种步态发现方法，尤其涉及的是资源受限情况下的基于质量-多样性优化的多足机器人多种步态发现方法，属于机器人控制。

技术介绍

1、随着机器人控制、强化学习、计算机视觉等领域的发展，多足机器人在复杂环境中完成人类给定任务的能力越来越强，够辅助甚至替代人类完成困难、危险的任务。例如，在地震灾难救援中，多足机器人可以替代人类在余震频发的地区寻找和救治伤员。在这个过程中，由于环境复杂多变，危险难以预测，机器人在任务执行中可能会遭遇不可逆的损伤。传统机器人控制策略仅能执行单一步态，一旦多足机器人某条足受损，难以维持原本的步态，运动速度大大降低，无法完成任务。为了克服这一问题，现有研究通过离线地发现多足机器人的多种步态，并在复杂环境部署中对对步态进行自动适应，能够在一定程度上解决复杂环境中的机器人控制问题。

2、质量多样性算法(quality-diversity，qd)是演化算法的一个子集，已成为解决这一具有挑战性的任务的典型算法，在许多现实世界任务中有着重要应用，例如机器人控制、策略集成和人机协作。qd算法...

【技术保护点】

1.一种资源受限情况下的多足机器人多种步态发现方法，其特征在于，只保存一个共享的感知模块，具体包括如下步骤：

2.根据权利要求1所述的资源受限情况下的多足机器人多种步态发现方法，其特征在于，对于步骤5，为了解决不匹配问题，定期用最新的共享感知模块重新评估策略集中的所有行动模块，并通过生存选择将它们添加回策略集；在策略集的每个单元中保留K个行动模块，K＞1，即维护一个具有K个层级的深度行动模块集其中集合每个单元格的每个层级都存储着一个行动模块，且前进速度随着层级的增加而降低。

3.根据权利要求2所述的资源受限情况下的多足机器人多种步态发现方法，其特征在于，通过只重新...

【技术特征摘要】

1.一种资源受限情况下的多足机器人多种步态发现方法，其特征在于，只保存一个共享的感知模块，具体包括如下步骤：

2.根据权利要求1所述的资源受限情况下的多足机器人多种步态发现方法，其特征在于，对于步骤5，为了解决不匹配问题，定期用最新的共享感知模块重新评估策略集中的所有行动模块，并通过生存选择将它们添加回策略集；在策略集的每个单元中保留k个行动模块，k＞1，即维护一个具有k个层级的深度行动模块集其中集合每个单元格的每个层级都存储着一个行动模块，且前进速度随着层级的增加而降低。

3.根据权利要求2所述的资源受限情况下的多足机器人多种步态发现方法，其特征在于，通过只重新评估深度行动模块集前k(1≤k≤k)层中的行动模块...

【专利技术属性】
技术研发人员：钱超，王任柬，薛轲，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人