【技术实现步骤摘要】
本专利技术涉及飞行系统控制,尤其涉及一种基于强化学习的变后掠飞行器轨迹跟踪控制方法及系统。
技术介绍
1、随着航空航天技术的快速发展,后掠飞行器作为一种具有优良气动特性的飞行器,在军事、民用和科研领域得到了广泛应用。然而,后掠飞行器的轨迹跟踪控制问题一直是飞行控制系统设计的难点之一。传统的控制方法往往基于固定的飞行状态进行设计,难以适应后掠飞行器在动态变化的气动力和运动学特性下的轨迹跟踪控制需求。因此,针对后掠飞行器的轨迹跟踪控制问题,开展深入系统的研究具有重要的理论和应用价值。
2、强化学习控制策略,可使得飞行器从不同初始状态收敛到达预设的终点。但在学习算法中训练网络时,动作空间大,训练速度较慢。为了改善这个问题,本专利技术借鉴轨迹跟踪控制设计思路,在强化学习的仿真环境中加入参考轨迹,将动作空间定义为当前动作和参考轨迹的误差从而减小动作搜索空间。此外,系统的参考轨迹一般都基于标称模型得到的,而实际系统中存在模型不确定性和障碍等问题。模型不确定性对传统的轨迹跟踪控制方法的控制效果影响较大。
技术实
...【技术保护点】
1.基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,包括:
2.如权利要求1所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,根据飞行器的机翼掠角变化、气动力和力矩系数变化、附加惯性力和飞行器运动参考轨迹,建立不确定性变后掠飞行器增量模型,包括,
3.如权利要求1或2所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,基于所述不确定性变后掠飞行器增量模型,通过确定性策略梯度算法,设计变后掠飞行器的动作空间和状态空间,包括,
4.如权利要求3所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,根
...【技术特征摘要】
1.基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,包括:
2.如权利要求1所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,根据飞行器的机翼掠角变化、气动力和力矩系数变化、附加惯性力和飞行器运动参考轨迹,建立不确定性变后掠飞行器增量模型,包括,
3.如权利要求1或2所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,基于所述不确定性变后掠飞行器增量模型,通过确定性策略梯度算法,设计变后掠飞行器的动作空间和状态空间,包括,
4.如权利要求3所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于,根据变后掠飞行器的飞行任务状态设计稀疏奖励函数,包括,
5.如权利要求4所述的基于强化学习的变后掠飞行器轨迹跟踪控制方法,其特征在于...
【专利技术属性】
技术研发人员:曹瑞,吕慧涛,徐亮,杨洋,蔡联忠,张乾哲,唐晨,张延猛,程嘉慧,
申请(专利权)人:扬州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。