一种基于深度学习的四足机器人运动的控制方法技术

技术编号:38606428 阅读:49 留言:0更新日期:2023-08-26 23:37
本发明专利技术提出一种基于深度学习的四足机器人运动的控制方法包括:S1:将四足机器人第一本身状态信息和第一外部环境信息输入强化学习算法中;S2:所述强化学习算法根据四足机器人运动参考轨迹做出足端轨迹规划,控制电机转动四足机器人运动;S3:得到四足机器人第二本身状态信息和第二外部环境信息输入至强化学习算法中,输出奖励值;S4:重复上述步骤,迭代出更高的累积奖励值,优化四足机器人的运动轨迹;实现四足机器人在路况复杂环境下步态稳定问题和步态规划。运用D

【技术实现步骤摘要】
一种基于深度学习的四足机器人运动的控制方法


[0001]本专利技术涉及四足机器人控制
,尤其涉及一种基于深度学习的四足机器人运动的控制方法。

技术介绍

[0002]四足机器人作为仿生机器人一个重要分支,涉及到人工智能、传感信息融合,仿生学、计算机仿真等多种学科知识,因具有较强的地形环境适应能力和运动灵活性,而备受国内外研究者关注,但在复杂路况中运动时,易被各种扰动因素干扰,使其稳定性受到巨大挑战。
[0003]深度学习是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法,作为人工智能领域快速发展分支,已被广泛应用于图像分析、语音识别、生物信息学等诸多领域并获得了较好的效果。通过在仿真环境中大量的训练学习,取得最优的控制策略,从而提高机器人环境适应能力。
[0004]公开号CN114609918A的中国专利文件就公开了一种四足机器人运动控制方法、系统、存储介质及设备,包括:获取四足机器人在环境中行走时的状态,通过策略网络根据状态选择动作;获取四足机器人在环境中行走时的足端位置,以计算得到参考动本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的四足机器人运动的控制方法,其特征在于,包括:构建四足机器人仿真建模:运用D

H矩阵建立四足机器人的腿部关节空坐标系的关系,推导出四足机器人正运动学和逆运动学方程,同时模拟不同杆长、步态参数得到柔性步态,获取各个关节的控制角度;构建深度强化学习模型:包括感知神经网络和决策神经网络,所述感知神经网络中设有深度学习算法,所述决策神经网络中设有强化学习算法,所述强化学习算法包括状态空间设计、动作空间设计和奖励函数设计,所述感知神经网络获取外部环境信息以及四足机器人本身的状态信息;根据所述四足机器人仿真模型和所述深度强化学习模型实现对所述四足机器人运动的控制方法包括以下步骤:S1:将四足机器人第一本身状态信息和第一外部环境信息输入强化学习算法中;S2:所述强化学习算法根据四足机器人运动参考轨迹做出足端轨迹规划,控制电机转动四足机器人运动;S3:得到四足机器人第二本身状态信息和第二外部环境信息输入至强化学习算法中,输出奖励值;S4:重复S1至S3步骤,迭代出更高的累积奖励值,优化四足机器人的运动轨迹。2.根据权利要求1所述的基于深度学习的四足机器人运动的控制方法,其特征在于,所述构建四足机器人仿真建模的步骤中:运用PyBullet仿真软件构建虚拟四足机器人仿真模型,采用D

H法建立正解和逆解运动学方程,分析机器人步态和单腿运动,推导出足端与机身坐标系的关系;同时对四足机器人四种步态:步行步态、四足跳跃步态、对角小跑步态、双足跳跃步态的运动稳定性进行初步模拟。3.根据权利要求1所述的基于深度学习的四足机器人运动的控制方法,其特征在于,所述构建深度强化学习模型包括:在深度强化学习模型分别将深度学习算法和强化学习算法以包含两个属性的元组表示,其中深度学习算法,强化学习算法,其中S表示外部环境信息,A表示执行的动作集合,P表示状态转移函数,R表示执行该状态转移函数得到的奖励值;假设t时刻环境状态为,执行a动作后进入下一个状态,状态转移函数表示为:;是动作a下变化最大的环境状态,是在t时刻实现的动作。4.根据权利要求3所述的基于深度学习的四足机器人运动的控制方法,其特征在于,所述奖励值R包括:表示四足机器人在执行动作a获得的奖励值;同时,在t时刻下四足机器人在状态选择并执行动作后,得到奖励值,并以P
转移到下一个时刻t+1的状态下选择并执行动作,并以P转移到下一个时刻t+2的状态,此过程一直进行下去,直至到达最终的目标状态,其计算奖励值的迭代过程表示为:;其中为折扣因子,n表示迭代次数,N是迭代总次数。5.根据权利要求4所述的基于深度学习的四足机器人运动的控制方法,其特征在于,所述奖励值与四足机器人...

【专利技术属性】
技术研发人员:管菊花
申请(专利权)人:江西机电职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1