【技术实现步骤摘要】
本专利技术涉及机器人与人工智能领域,特别涉及一种融合强化学习与进化计算的足式步态与形态协同进化系统。
技术介绍
1、足式机器人因其理论上优越的地形适应性和运动灵活性,在复杂非结构化环境中的应用潜力巨大,例如搜索救援、物资运输、环境勘探等。然而,实现足式机器人高速、稳定且高效的运动控制仍然面临诸多挑战。
2、现有的足式机器人运动控制方法主要包括基于模型的控制方法(如模型预测控制(model predictive control,mpc))、基于中央模式发生器(central pattern generator,cpg)的方法和基于虚拟模型控制(virtual model control,vmc)的方法等。基于模型的控制方法通常依赖于精确的机器人动力学模型,但在高速运动或与环境发生复杂交互时,模型的准确性难以保证,且计算复杂度较高。cpg方法能够生成节律性步态,但在快速变化和非周期性扰动下的适应性有限。vmc方法直观易实现,但其性能依赖于虚拟组件参数的经验选择和调整。
3、近年来,深度强化学习(deep reinfo
...【技术保护点】
1.一种融合强化学习与进化计算的足式步态与形态协同进化系统,其特征在于,用于自动地生成适用于足式机器人的运动控制策略以及适用于足式机器人的形态进化方法,该运动控制策略进而被用于获得适用于足式机器人的足式步态,该形态协同进化方法进而被用于获得适用于足式机器人的形态改进依据;足式机器人的具体形式包含四足机器人、双足机器人;
2.根据权利要求1所述的一种融合强化学习与进化计算的足式步态与形态协同进化系统,其特征在于,实时运动控制策略学习模块(1)采用动态掩码集成双Q学习算法,即DME-DQL算法,包含动态掩码机制(14);动态掩码机制(14)包括:
...
【技术特征摘要】
1.一种融合强化学习与进化计算的足式步态与形态协同进化系统,其特征在于,用于自动地生成适用于足式机器人的运动控制策略以及适用于足式机器人的形态进化方法,该运动控制策略进而被用于获得适用于足式机器人的足式步态,该形态协同进化方法进而被用于获得适用于足式机器人的形态改进依据;足式机器人的具体形式包含四足机器人、双足机器人;
2.根据权利要求1所述的一种融合强化学习与进化计算的足式步态与形态协同进化系统,其特征在于,实时运动控制策略学习模块(1)采用动态掩码集成双q学习算法,即dme-dql算法,包含动态掩码机制(14);动态掩码机制(14)包括:
3.根据权利要求2所述的一种融合强化学习与进化计算的足式步态与形态协同进化系统,其特征在于,dme-dql算法进一步包含:演员网络(11),用于根据当前状态输出动作或动作的概率分布;两个评论家网络(12),用于估计状态-动作价值函数,其参数φi中的i为评论家网络的序号,通过最小化贝尔曼误差进行更新,目标函数为:
4.根据权利要求2所述的一种融合强化学习与进化计算的足式步态与形态协同进化系统,其特征在于,步态与形态协同优化模块(2)采用遗传算法作为其进化计算核心,遗传算法包含:
5.根据权利要求4所述的一种融合强化学习与进化计算的足式步态与形态协同进化系统,其特征在于,适应度评估子模块(22)包括:
6.根据权利要求4所述的一种融合强化学习与进化计算的足...
【专利技术属性】
技术研发人员:贾文川,何东,孙翊,王钰,包天旭,
申请(专利权)人:上海大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。