当前位置: 首页 > 专利查询>滨州学院专利>正文

一种针对四旋翼无人机姿态的强化学习优化控制方法技术

技术编号:34450192 阅读:74 留言:0更新日期:2022-08-06 16:50
本发明专利技术涉及自适应非线性控制技术领域,具体公开了一种针对四旋翼无人机姿态的强化学习优化控制方法,通过利用模糊系统的函数逼近性质,构造两个迭代网络:评价和执行网络用于执行强化学习,从而最终获得该优化姿态控制,因为该优化控制要求同时控制姿态角和角速度两个状态,它需要同时包含角变量和角速度的两个跟踪误差项,这样,如果设计该强化学习借鉴传统的方法,此优化控制算法将非常复杂。本发明专利技术首先是设计一个与HJB等式等价的简单正函数,然后利用该函数的负梯度构建强化学习,这样该控制的算法能是明显简单,最后,通过理论证明和计算机仿真,证明该优化姿态控制能够完成控制任务。成控制任务。成控制任务。

【技术实现步骤摘要】
一种针对四旋翼无人机姿态的强化学习优化控制方法


[0001]本专利技术涉及自适应非线性控制
,具体涉及一种针对四旋翼无人机姿态的强化 学习优化控制方法。

技术介绍

[0002]四旋翼无人机(Quadrotor Unmanned Aerial Vehicle,简写:QUAV)系统是通过改变其 四个螺旋桨的旋转速度来进行控制。由于特殊的结构特点,QUAV具有垂直起降、高度 敏捷性、精确悬停和结构简单等优点。目前,它已成为应用最广泛的微型无人机,如农 田调查、山火观测、搜救行动等等。实现一个QUAV系统的高敏捷度自主飞行,姿态控 制是一个核心问题。
[0003]近年来,随着科学技术的发展,最优控制成为一个活跃而热门的研究课题。最优控 制目的是用最少控制资源实现控制目标。然而,QUAV的姿态动力是一个二阶非线性系 统,因此姿态控制应该要求不仅对姿态角进行控制,还要对角速度进行控制。目前,大 多数存在的优化控制方法只能管理单个系统状态,而不能管理多个状态变量,因此,不 能完全符合QUAV姿态控制的要求。为此,本专利技术提出了一种基于强化学习本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种针对四旋翼无人机姿态的强化学习优化控制方法,其特征在于,包括以下步骤:步骤1)对四旋翼无人机姿态动力系统进行坐标转化,将其动力方程从机体坐标系转化到地球坐标系;步骤2)建立姿态动力系统的姿态角状态和角速度状态与参考信号之间的跟踪误差,并建立误差动力方程;步骤3)利用误差动力方程,定义最优性能指标函数,并利用动力方程获得HJB等式;步骤4)通过求解HJB的偏导方程,获得最优姿态控制解,然后通过加减误差项,从而变形最优姿态控制,实现其跟踪性能;步骤5)利用模糊系统对最优姿态控制中的未知非线性项进行逼近;步骤6)设计评判

执行结构的强化学习算法;步骤7)针对步骤6)中获得的强化学习优化姿态控制,设计李雅普诺夫函数,对其进行稳定性和误差收敛性分析;步骤8)利用Matlab软件进行仿真实验。2.根据权利要求1所述的针对四旋翼无人机姿态的强化学习优化控制方法,其特征在于,所述步骤1)中的机体坐标系转化到地球坐标系转化后的姿态动力方程为:其中:3.根据权利要求1所述的针对四旋翼无人机姿态的强化学习优化控制方法,其特征在于,所述步骤2)中的姿态角状态为ζ1(t),角速度状态为ζ2(t),参考信号为姿态角状态为ζ1(t)与参与信号之间的跟踪误差为e1(t)=ζ1(t)

ζ
r1
(t),角速度状态为ζ2(t)与参与信号之间的跟踪误差为e2(t)=ζ2(t)

ζ
r2
(t),建立误差动力方程为:立误差动力方程为:4.根据权利要求1所述的针对四旋翼无人机姿态的强化学习优化控制方法,其特征在于,所述步骤3)中的最优性能指标函数为其中:进一步...

【专利技术属性】
技术研发人员:文国兴高发亮郝伟
申请(专利权)人:滨州学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1