一种基于强化学习的高速飞行器姿态控制方法及应用技术

技术编号:42203778 阅读:17 留言:0更新日期:2024-07-30 18:49
本发明专利技术属于高速飞行器姿态控制领域,针对现有的飞行器在控制过程中容易出现抖震现象的问题,提出一种基于强化学习的高速飞行器姿态控制方法及应用。方法包括:步骤1:建立高速飞行器俯仰动力学模型;步骤2:建立高速飞行器侧倾侧角幅值的约束模型;步骤3:确定攻角剖面和高度能量剖面,解析攻角和倾侧角;步骤4:基于步骤3的攻角、倾侧角以及阶梯状混合奖励函数,构建两个神经网络;步骤5:建立基于步骤4神经网络的PID控制器,通过阶梯状混合奖励函数训练神经网络,实现对高速飞行器的姿态控制。本发明专利技术拓展了传统PID参数控制决策空间,减少了翻转次数,克服了传统二值决策易于超出边界区域的缺陷,有效提高了任务实现效能。

【技术实现步骤摘要】

本专利技术属于高速飞行器姿态控制领域,具体涉及一种基于强化学习的高速飞行器姿态控制方法及应用


技术介绍

1、高速飞行器姿态控制是近年来高速飞行器研究的核心和重点之一,在复杂的飞行环境下实现快速、精确、稳定的姿态控制仍是要研究的难题。

2、高速飞行器本身具有强耦合、强非线性、强不确定性的特点,同时飞行环境中还存在着各种外界干扰,飞行高度和马赫数跨度范围大、飞行环境复杂、气动特性变化剧烈、飞行约束条件多,对高速飞行器姿态控制系统提出了较高的要求。

3、目前已经有很多控制方法被研究应用于高速飞行器控制设计系统中:1.传统的线性控制方法适应性强、应用简单,但是会产生较大的误差,甚至造成系统不稳定;2.反馈线性化方法设计简单,鲁棒性较好,但是需要精确的数学模型,而高速飞行器的精确模型难以取得;3.反步法设计灵活,适用范围广,但在系统阶数增多时容易出现微分爆炸,导致计算量增大;4.滑模控制响应速度快、鲁棒性强,但是在控制过程中容易出现抖震现象,可能激发高速飞行器系统中的高频模态而导致飞行器失稳,且滑模面求导复杂,计算资源消耗大,在线应用难度大本文档来自技高网...

【技术保护点】

1.一种基于强化学习的高速飞行器姿态控制方法,其特征在于:包括:

2.根据权利要求1所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤4的阶梯状混合奖励函数为:

3.根据权利要求2所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤4构建两个神经网络包括:

4.根据权利要求3所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤5包括:

5.一种基于强化学习的高速飞行器姿态控制器,其特征在于:基于权利要求1-4任一项所述的基于强化学习的高速飞行器姿态控制方法构建而成。

6.一种基于强化学习的高...

【技术特征摘要】

1.一种基于强化学习的高速飞行器姿态控制方法,其特征在于:包括:

2.根据权利要求1所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤4的阶梯状混合奖励函数为:

3.根据权利要求2所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤4构建两个神经网络包括:

4.根据权利要求3所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤5包括:

5.一种基于强化学习的高速飞行器姿态控制器,其特征在于:基于权利要求1...

【专利技术属性】
技术研发人员:蔡光斌刘静文肖永强郝明瑞穆朝絮杨波李欣徐慧
申请(专利权)人:中国人民解放军火箭军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1