【技术实现步骤摘要】
一种针对四旋翼无人机姿态的强化学习优化控制方法
[0001]本专利技术涉及自适应非线性控制
,具体涉及一种针对四旋翼无人机姿态的强化 学习优化控制方法。
技术介绍
[0002]四旋翼无人机(Quadrotor Unmanned Aerial Vehicle,简写:QUAV)系统是通过改变其 四个螺旋桨的旋转速度来进行控制。由于特殊的结构特点,QUAV具有垂直起降、高度 敏捷性、精确悬停和结构简单等优点。目前,它已成为应用最广泛的微型无人机,如农 田调查、山火观测、搜救行动等等。实现一个QUAV系统的高敏捷度自主飞行,姿态控 制是一个核心问题。
[0003]近年来,随着科学技术的发展,最优控制成为一个活跃而热门的研究课题。最优控 制目的是用最少控制资源实现控制目标。然而,QUAV的姿态动力是一个二阶非线性系 统,因此姿态控制应该要求不仅对姿态角进行控制,还要对角速度进行控制。目前,大 多数存在的优化控制方法只能管理单个系统状态,而不能管理多个状态变量,因此,不 能完全符合QUAV姿态控制的要求。为此,本专利技术提 ...
【技术保护点】
【技术特征摘要】
1.一种针对四旋翼无人机姿态的强化学习优化控制方法,其特征在于,包括以下步骤:步骤1)对四旋翼无人机姿态动力系统进行坐标转化,将其动力方程从机体坐标系转化到地球坐标系;步骤2)建立姿态动力系统的姿态角状态和角速度状态与参考信号之间的跟踪误差,并建立误差动力方程;步骤3)利用误差动力方程,定义最优性能指标函数,并利用动力方程获得HJB等式;步骤4)通过求解HJB的偏导方程,获得最优姿态控制解,然后通过加减误差项,从而变形最优姿态控制,实现其跟踪性能;步骤5)利用模糊系统对最优姿态控制中的未知非线性项进行逼近;步骤6)设计评判
‑
执行结构的强化学习算法;步骤7)针对步骤6)中获得的强化学习优化姿态控制,设计李雅普诺夫函数,对其进行稳定性和误差收敛性分析;步骤8)利用Matlab软件进行仿真实验。2.根据权利要求1所述的针对四旋翼无人机姿态的强化学习优化控制方法,其特征在于,所述步骤1)中的机体坐标系转化到地球坐标系转化后的姿态动力方程为:其中:3.根据权利要求1所述的针对四旋翼无人机姿态的强化学习优化控制方法,其特征在于,所述步骤2)中的姿态角状态为ζ1(t),角速度状态为ζ2(t),参考信号为姿态角状态为ζ1(t)与参与信号之间的跟踪误差为e1(t)=ζ1(t)
‑
ζ
r1
(t),角速度状态为ζ2(t)与参与信号之间的跟踪误差为e2(t)=ζ2(t)
‑
ζ
r2
(t),建立误差动力方程为:立误差动力方程为:4.根据权利要求1所述的针对四旋翼无人机姿态的强化学习优化控制方法,其特征在于,所述步骤3)中的最优性能指标函数为其中:进一步...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。