当前位置: 首页 > 专利查询>扬州大学专利>正文

基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统技术方案

技术编号:40575300 阅读:23 留言:0更新日期:2024-03-06 17:16
本发明专利技术公开了一种基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统,方法包括:根据飞行器相关系数和飞行器运动参考轨迹,建立不确定性变后掠飞行器增量模型;通过确定性策略梯度算法,设计变后掠飞行器的动作空间和状态空间;基于参考轨迹,根据变后掠飞行器设计稀疏奖励函数和非稀疏奖励函数相结合得到复合奖励函数;将LSTM融入强化学习算法,建立IDDPG算法对变后掠飞行器轨迹进行跟踪控制。本发明专利技术基于参考轨迹,得到的增量模型和动作空间,可以减小动作的探索空间,从而加快收敛速度;加入LSTM的IDDPG算法相对于传统DDPG算法能够更快地收敛到一个更大的平均奖励,结果更加稳定,并且避免在变掠角飞行器的爬升阶段进行不必要的探索。

【技术实现步骤摘要】

本专利技术涉及飞行系统控制,尤其涉及一种基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统


技术介绍

1、随着航空航天技术的快速发展,后掠飞行器作为一种具有优良气动特性的飞行器,在军事、民用和科研领域得到了广泛应用。然而,后掠飞行器的轨迹跟踪控制问题一直是飞行控制系统设计的难点之一。传统的控制方法往往基于固定的飞行状态进行设计,难以适应后掠飞行器在动态变化的气动力和运动学特性下的轨迹跟踪控制需求。因此,针对后掠飞行器的轨迹跟踪控制问题,开展深入系统的研究具有重要的理论和应用价值。

2、强化学习控制策略,可使得飞行器从不同初始状态收敛到达预设的终点。但在学习算法中训练网络时,动作空间大,训练速度较慢。为了改善这个问题,本专利技术借鉴轨迹跟踪控制设计思路,在强化学习的仿真环境中加入参考轨迹,将动作空间定义为当前动作和参考轨迹的误差从而减小动作搜索空间。此外,系统的参考轨迹一般都基于标称模型得到的,而实际系统中存在模型不确定性和障碍等问题。模型不确定性对传统的轨迹跟踪控制方法的控制效果影响较大。


技术实现思路...

【技术保护点】

1.基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,包括:

2.如权利要求1所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,根据飞行器的机翼掠角变化、气动力和力矩系数变化、附加惯性力和飞行器运动参考轨迹,建立不确定性变后掠飞行器增量模型,包括,

3.如权利要求1或2所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,基于所述不确定性变后掠飞行器增量模型,通过确定性策略梯度算法,设计变后掠飞行器的动作空间和状态空间,包括,

4.如权利要求3所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,根据变后掠飞行器的飞行...

【技术特征摘要】

1.基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,包括:

2.如权利要求1所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,根据飞行器的机翼掠角变化、气动力和力矩系数变化、附加惯性力和飞行器运动参考轨迹,建立不确定性变后掠飞行器增量模型,包括,

3.如权利要求1或2所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,基于所述不确定性变后掠飞行器增量模型,通过确定性策略梯度算法,设计变后掠飞行器的动作空间和状态空间,包括,

4.如权利要求3所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,根据变后掠飞行器的飞行任务状态设计稀疏奖励函数,包括,

5.如权利要求4所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于...

【专利技术属性】
技术研发人员:曹瑞吕慧涛徐亮杨洋蔡联忠张乾哲唐晨张延猛程嘉慧
申请(专利权)人:扬州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1