【技术实现步骤摘要】
本专利技术属于高速飞行器姿态控制领域,具体涉及一种基于强化学习的高速飞行器姿态控制方法及应用。
技术介绍
1、高速飞行器姿态控制是近年来高速飞行器研究的核心和重点之一,在复杂的飞行环境下实现快速、精确、稳定的姿态控制仍是要研究的难题。
2、高速飞行器本身具有强耦合、强非线性、强不确定性的特点,同时飞行环境中还存在着各种外界干扰,飞行高度和马赫数跨度范围大、飞行环境复杂、气动特性变化剧烈、飞行约束条件多,对高速飞行器姿态控制系统提出了较高的要求。
3、目前已经有很多控制方法被研究应用于高速飞行器控制设计系统中:1.传统的线性控制方法适应性强、应用简单,但是会产生较大的误差,甚至造成系统不稳定;2.反馈线性化方法设计简单,鲁棒性较好,但是需要精确的数学模型,而高速飞行器的精确模型难以取得;3.反步法设计灵活,适用范围广,但在系统阶数增多时容易出现微分爆炸,导致计算量增大;4.滑模控制响应速度快、鲁棒性强,但是在控制过程中容易出现抖震现象,可能激发高速飞行器系统中的高频模态而导致飞行器失稳,且滑模面求导复杂,计算资源消
...【技术保护点】
1.一种基于强化学习的高速飞行器姿态控制方法,其特征在于:包括:
2.根据权利要求1所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤4的阶梯状混合奖励函数为:
3.根据权利要求2所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤4构建两个神经网络包括:
4.根据权利要求3所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤5包括:
5.一种基于强化学习的高速飞行器姿态控制器,其特征在于:基于权利要求1-4任一项所述的基于强化学习的高速飞行器姿态控制方法构建而成。
6.
...【技术特征摘要】
1.一种基于强化学习的高速飞行器姿态控制方法,其特征在于:包括:
2.根据权利要求1所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤4的阶梯状混合奖励函数为:
3.根据权利要求2所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤4构建两个神经网络包括:
4.根据权利要求3所述的一种基于强化学习的高速飞行器姿态控制方法,其特征在于:步骤5包括:
5.一种基于强化学习的高速飞行器姿态控制器,其特征在于:基于权利要求1...
【专利技术属性】
技术研发人员:蔡光斌,刘静文,肖永强,郝明瑞,穆朝絮,杨波,李欣,徐慧,
申请(专利权)人:中国人民解放军火箭军工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。