一种针对四旋翼无人机姿态的强化学习优化控制方法技术

技术编号：34450192 阅读：74 留言：0更新日期：2022-08-06 16:50

本发明专利技术涉及自适应非线性控制技术领域，具体公开了一种针对四旋翼无人机姿态的强化学习优化控制方法，通过利用模糊系统的函数逼近性质，构造两个迭代网络：评价和执行网络用于执行强化学习，从而最终获得该优化姿态控制，因为该优化控制要求同时控制姿态角和角速度两个状态，它需要同时包含角变量和角速度的两个跟踪误差项，这样，如果设计该强化学习借鉴传统的方法，此优化控制算法将非常复杂。本发明专利技术首先是设计一个与HJB等式等价的简单正函数，然后利用该函数的负梯度构建强化学习，这样该控制的算法能是明显简单，最后，通过理论证明和计算机仿真，证明该优化姿态控制能够完成控制任务。成控制任务。成控制任务。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对四旋翼无人机姿态的强化学习优化控制方法

[0001]本专利技术涉及自适应非线性控制
，具体涉及一种针对四旋翼无人机姿态的强化学习优化控制方法。

技术介绍

[0002]四旋翼无人机(Quadrotor Unmanned Aerial Vehicle,简写：QUAV)系统是通过改变其四个螺旋桨的旋转速度来进行控制。由于特殊的结构特点，QUAV具有垂直起降、高度敏捷性、精确悬停和结构简单等优点。目前，它已成为应用最广泛的微型无人机，如农田调查、山火观测、搜救行动等等。实现一个QUAV系统的高敏捷度自主飞行，姿态控制是一个核心问题。
[0003]近年来，随着科学技术的发展，最优控制成为一个活跃而热门的研究课题。最优控制目的是用最少控制资源实现控制目标。然而，QUAV的姿态动力是一个二阶非线性系统，因此姿态控制应该要求不仅对姿态角进行控制，还要对角速度进行控制。目前，大多数存在的优化控制方法只能管理单个系统状态，而不能管理多个状态变量，因此，不能完全符合QUAV姿态控制的要求。为此，本专利技术提...

【技术保护点】

【技术特征摘要】
1.一种针对四旋翼无人机姿态的强化学习优化控制方法，其特征在于，包括以下步骤：步骤1)对四旋翼无人机姿态动力系统进行坐标转化，将其动力方程从机体坐标系转化到地球坐标系；步骤2)建立姿态动力系统的姿态角状态和角速度状态与参考信号之间的跟踪误差，并建立误差动力方程；步骤3)利用误差动力方程，定义最优性能指标函数，并利用动力方程获得HJB等式；步骤4)通过求解HJB的偏导方程，获得最优姿态控制解，然后通过加减误差项，从而变形最优姿态控制，实现其跟踪性能；步骤5)利用模糊系统对最优姿态控制中的未知非线性项进行逼近；步骤6)设计评判
‑
执行结构的强化学习算法；步骤7)针对步骤6)中获得的强化学习优化姿态控制，设计李雅普诺夫函数，对其进行稳定性和误差收敛性分析；步骤8)利用Matlab软件进行仿真实验。2.根据权利要求1所述的针对四旋翼无人机姿态的强化学习优化控制方法，其特征在于，所述步骤1)中的机体坐标系转化到地球坐标系转化后的姿态动力方程为：其中：3.根据权利要求1所述的针对四旋翼无人机姿态的强化学习优化控制方法，其特征在于，所述步骤2)中的姿态角状态为ζ1(t)，角速度状态为ζ2(t)，参考信号为姿态角状态为ζ1(t)与参与信号之间的跟踪误差为e1(t)＝ζ1(t)
‑
ζ
r1
(t)，角速度状态为ζ2(t)与参与信号之间的跟踪误差为e2(t)＝ζ2(t)
‑
ζ
r2
(t)，建立误差动力方程为：立误差动力方程为：4.根据权利要求1所述的针对四旋翼无人机姿态的强化学习优化控制方法，其特征在于，所述步骤3)中的最优性能指标函数为其中：进一步...

【专利技术属性】
技术研发人员：文国兴，高发亮，郝伟，
申请(专利权)人：滨州学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人