一种多四旋翼无人机输出约束状态一致博弈控制器制造技术

技术编号:31759326 阅读:22 留言:0更新日期:2022-01-05 16:43
本发明专利技术公开了一种多四旋翼无人机输出约束状态一致博弈控制器,将N个含输出约束的四旋翼无人机视为跟随者,其与领导者通过单向拓扑图连接成的网络化系统作为被控对象,利用系统转换技术和ADP技术设计具有输出约束的状态一致博弈控制器,使得含扰动的跟随四旋翼无人机跟踪领导者的状态轨迹。本发明专利技术考虑到四旋翼无人机飞行姿态中角度的限制,通过系统转换技术,将含输出约束的多四旋翼无人机姿态控制系统转化为无约束系统;借助ADP技术和博弈方法,设计的输出约束状态一致博弈控制器不仅使四旋翼无人机姿态控制系统稳定,且满足输出约束的要求,同时使得转换后系统的性能指标达到近似最优。似最优。似最优。

【技术实现步骤摘要】
一种多四旋翼无人机输出约束状态一致博弈控制器


[0001]本专利技术涉及工业过程控制
,具体而言涉及一种多四旋翼无人机输出约束状态一致博弈控制器。

技术介绍

[0002]20世纪以来,随着自动化技术的成熟和发展,多四旋翼无人机系统作为一种更为复杂和先进的机电系统出现在生产与科研等多个方面,众多科研工作者对多四旋翼无人机系统的控制问题展开了深入的研究。与单个的四旋翼无人机系统相比,多四旋翼无人机能够完成更复杂的任务,且具有更大的负荷能力。然而,多四旋翼无人机系统这些优点的获得是需要付出代价的,包括更为复杂的控制问题。将在该协调系统中的某一四旋翼无人机指定为“领导者”,其余的跟踪领导者的预定队形的移动机器人称为“跟随者”群体。在2019年,杜海波等人在有向通信拓扑下,针对一类多四旋翼飞行器的领导

跟随者结构分布式编队控制问题,提出了一种基于反步法的一致性编队控制算法,其在仿真案例中四旋翼飞行器的姿态角和位置作为输出量,让所有四旋翼飞行器在三维空间中收敛到期望的编队形态。但是在很多的实际应用中,四旋翼飞行器在运行中无法避免外部扰动的影响,四旋翼飞行器的姿态角需要限定在特定的范围,且系统的最优性能也是值得考虑的。
[0003]ADP方法是求解最优控制问题的有效工具,它起源于1957年,Bellman提出的DP方法,该方法核心是贝尔曼最优原理。这个原理可以归结为一个基本的递推公式,求解HJB方程。但是DP方法存在着“维数灾”问题。为了克服这些弱点,Werbos首先提出了ADP方法的框架,其主要思想是利用一个函数近似结构来估计代价函数,然后求解HJB方程进而获得近似最优控制策略。近年来,ADP方法获得了广泛的关注。基于神经网络技术和ADP方法,Ferrari设计状态反馈ADP控制器。黄玉柱提出了基于状态反馈的有界鲁棒ADP控制器,用于控制具有输入约束的不确定仿射非线性连续时间系统。用自适应动态规划算法,赵博研究一类仿射非线性系统的容错控制。在自适应动态规划的基础上,屈秋霞研究了一种基于输入饱和的不确定非线性系统的复合滑模控制器。针对一类具有输入饱和的非线性连续时间系统,在系统状态不完全可测的情况下,朱元恒利用ADP方法设计出事件触发近似最优控制器。利用模糊逻辑系统逼近系统的不确定性,张化光设计出一类仿射型非线性多智能体系统的近似最优一致控制方案。针对具有未知动态的仿射型非线性多智能体系统,张吉烈设计分布式最优一致控制器。Mazouchi提出了一种在线最优分布式学习算法来解决非线性多智能体微分图形博弈的领导同步问题。通过自适应动态规划方法,完全未知动态的连续时间非线性多智能体系统的分布式最优协调控制问题被研究。一方面,输出问题受限问题在实际工业应用中也是亟需处理的。针对带有输出约束的非线性系统的控制问题,范泉涌和杨光红中提出了一种具有松弛函数的系统变换技术。通过提出一个具有新状态变量的增强系统,以将原始约束问题转换为无约束问题。还有,杨秦敏通过引入一个映射函数来处理输出约束。通过对原系统进行转换,使得转换后的系统等效于原输出约束系统。另一方面,针对含扰动的非线性零和微分博弈,宋睿卓提出基于单神经网络和最小二乘的鲁棒最优控制。穆
朝絮等人将基于博弈的最优控制方法应用到在电力系统上。2016年,魏庆来等人针对具有扰动的零和博弈问题,根据非线性系统的输入输出数据,引入了有效的递归神经网络来重构非线性系统的动力学,并提出了一种连续时间未知非线性系统的数据驱动零和神经最优控制方法。2018年,孙景亮针对一类具有输出和输入约束的严格反馈非线性系统的零和微分博弈问题,提出了拦截操纵目标的问题。将反步法引入零和微分博弈中,拓宽微分博弈的应用范围,并且将零和微分博弈方法应用到导弹

目标拦截系统中。
[0004]在实际的应用中,对多四旋翼无人机的姿态一致协同控制时,由于每个四旋翼无人机姿态控制系统中存在着外部扰动,无法实现对扰动的精准建模,以及系统的输出姿态需要限定在特定的范围,还有使得系统稳定的同时,系统的最优性也是需要考虑的,所以针对遭受外部扰动的多四旋翼无人机输出约束状态一致博弈控制研究具有重要的理论意义和现实意义。因此,迫切需要一种利用系统转换技术、ADP技术和博弈方法的输出约束状态一致博弈控制器,使得对遭受外部扰动的多四旋翼无人机的输出约束状态一致协同的研究具有最直接的现实意义。

技术实现思路

[0005]本专利技术针对现有技术中的不足,提供一种多四旋翼无人机输出约束状态一致博弈控制器,针对四旋翼无人机系统中对输出姿态角的约束问题,通过系统转换技术,将含约束的多四旋翼无人机姿态控制系统转化为无约束的控制系统。考虑到多四旋翼无人机姿态控制系统的未知外部扰动,利用博弈的方法,设计出输出约束状态一致博弈控制器,使得系统达到稳定,并且达到状态一致的控制效果。
[0006]为实现上述目的,本专利技术采用以下技术方案:
[0007]第一方面,本专利技术实施例提出了一种多四旋翼无人机输出约束状态一致博弈控制器,所述博弈控制器用于控制网络化系统中的各个跟随者;该网络化系统由一个领导者与N个跟随者通过单向拓扑图连接构成,所述跟随者为网络化系统中除领导者外的、含有输出约束的四旋翼无人机;领导者与至少一个跟随者之间存在通信连接,N个跟随者之间存在通信连接,跟随者之间的信息通信采用有向图表示,其中v为节点的非空有限集合,且v={v1,

,v
N
},ε为边的集合,且ε={(v
j
,v
i
)∈v
×
v},v
i
为第i个移动机器人,v
j
为第j个移动机器人;(v
j
,v
i
)∈v
×
v表示第i个移动机器人能够直接获得第j个移动机器人的信息;其中,i、j为所述跟随者的编号,且1≤i≤N,1≤j≤N;
[0008]所述博弈控制器包括滚转角子控制器、俯仰角子控制器和偏航角子控制器;所述滚转角子控制器、俯仰角子控制器和偏航角子控制器的输入端均与有向图的输出端相连,输出端均与跟随者的输入端连接;
[0009]所述滚转角子控制器包括滚转角姿态系统转换单元、滚转角姿态一致误差运算单元、ADP滚转角姿态逼近器单元、ADP滚转角姿态运算单元、ADP滚转角姿态第i,1,1子控制单元和设计ADP滚转角姿态第i,1,2子控制单元;
[0010]所述滚转角姿态系统转换单元的输入端为第i个跟随者的状态x
i,1,1
和x
i,1,2
,和第i个跟随者的输出y
i,1

[0011]所述滚转角姿态一致误差运算单元的输入端分别为有向图中第j个跟随者转换后的状态s
j,1,1
和s
j,1,2
、跟随者的邻接通信a
ij
、领导者的邻接通信b
i
、滚转角姿态系统转换
单元的输出s
i,1,1
和s...

【技术保护点】

【技术特征摘要】
1.一种多四旋翼无人机输出约束状态一致博弈控制器,其特征在于,所述博弈控制器用于控制网络化系统中的各个跟随者;该网络化系统由一个领导者与N个跟随者通过单向拓扑图连接构成,所述跟随者为网络化系统中除领导者外的、含有输出约束的四旋翼无人机;领导者与至少一个跟随者之间存在通信连接,N个跟随者之间存在通信连接,跟随者之间的信息通信采用有向图表示,其中v为节点的非空有限集合,且v={v1,

,v
N
},ε为边的集合,且ε={(v
j
,v
i
)∈v
×
v},v
i
为第i个移动机器人,v
j
为第j个移动机器人;(v
j
,v
i
)∈v
×
v表示第i个移动机器人能够直接获得第j个移动机器人的信息;其中,i、j为所述跟随者的编号,且1≤i≤N,1≤j≤N;所述博弈控制器包括滚转角子控制器、俯仰角子控制器和偏航角子控制器;所述滚转角子控制器、俯仰角子控制器和偏航角子控制器的输入端均与有向图的输出端相连,输出端均与跟随者的输入端连接;所述滚转角子控制器包括滚转角姿态系统转换单元、滚转角姿态一致误差运算单元、ADP滚转角姿态逼近器单元、ADP滚转角姿态运算单元、ADP滚转角姿态第i,1,1子控制单元和设计ADP滚转角姿态第i,1,2子控制单元;所述滚转角姿态系统转换单元的输入端为第i个跟随者的状态x
i,1,1
和x
i,1,2
,和第i个跟随者的输出y
i,1
;所述滚转角姿态一致误差运算单元的输入端分别为有向图中第j个跟随者转换后的状态s
j,1,1
和s
j,1,2
、跟随者的邻接通信a
ij
、领导者的邻接通信b
i
、滚转角姿态系统转换单元的输出s
i,1,1
和s
i,1,2
和领导者中滚转角姿态系统转换后的状态s
0,1,1
和s
0,1,2
;所述ADP滚转角姿态逼近器单元的输入端分别为滚转角姿态一致误差运算单元的输出e
i,1,1
和e
i,1,2
、第i,1,1ADP子控制单元的输出u
i,1
和第i,1,2ADP子控制单元的输出d
i,1
;所述ADP滚转角姿态运算单元的输入端是ADP滚转角姿态逼近器单元的输出所述ADP滚转角姿态第i,1,1子控制单元的输入端分别是ADP滚转角姿态运算单元的输出和有向图中的拉普拉斯矩阵中的参数l
ii
和领导者的邻接通信b
i
;所述ADP滚转角姿态第i,1,2子控制单元的输入端分别是ADP滚转角姿态运算单元的输出和有向图中的拉普拉斯矩阵中的参数l
ii
和领导者的邻接通信b
i
;所述俯仰角子控制器包括俯仰角姿态系统转换单元、俯仰角姿态一致误差运算单元、ADP俯仰角姿态逼近器单元、ADP俯仰角姿态运算单元、ADP俯仰角姿态第i,2,1子控制单元和设计ADP俯仰角姿态第i,2,2子控制单元;所述俯仰角姿态系统转换单元的输入端为第i个跟随者的状态x
i,2,1
和x
i,2,2
,和第i个跟随者的输出y
i,2
;所述俯仰角姿态一致误差运算单元的输入端分别为有向图中第j个跟随者转换后的状态s
j,2,1
和s
j,2,2
、跟随者的邻接通信a
ij
、领导者的邻接通信b
i
、俯仰角姿态系统转换单元的输出s
i,2,1
和s
i,2,2
和领导者中俯仰角姿态系统转换后的状态s
0,2,1
和s
0,2,2
;所述ADP俯仰角姿态逼近器单元的输入端分别为俯仰角姿态一致误差运算单元的输出
e
i,2,1
和e
i,2,2
、第i,2,1ADP子控制单元的输出u
i,2
和第i,2,2ADP子控制单元的输出d
i,2
;所述ADP俯仰角姿态运算单元的输入端是ADP俯仰角姿态逼近器单元的输出所述ADP俯仰角姿态第i,2,1子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出和有向图中的拉普拉斯矩阵中的参数l
ii
和领导者的邻接通信b
i
;所述ADP俯仰角姿态第i,2,2子控制单元的输入端分别是ADP俯仰角姿态运算单元的输出和有向图中的拉普拉斯矩阵中的参数l
ii
和领导者的邻接通信b
i
;所述偏航角子控制器包括偏航角姿态系统转换单元、偏航角姿态一致误差运算单元、ADP偏航角姿态逼近器单元、ADP偏航角姿态运算单元、ADP偏航角姿态第i,3,1子控制单元和设计ADP偏航角姿态第i,3,2子控制单元;所述偏航角姿态系统转换单元的输入端为第i个跟随者的状态x
i,3,1
和x
i,3,2
,和第i个跟随者的输出y
i,3
;所述偏航角姿态一致误差运算单元的输入端分别为有向图中第j个跟随者转换后的状态s
j,3,1
和s
j,3,2
、跟随者的邻接通信a
ij
、领导者的邻接通信b
i
、偏航角姿态系统转换单元的输出s
i,3,1
和s
i,3,2
和领导者中偏航角姿态系统转换后的状态s
0,3,1
和s
0,3,2
;所述ADP偏航角姿态逼近器单元的输入端分别为偏航角姿态一致误差运算单元的输出e
i,3,1
和e
i,3,2
、第i,3,1ADP子控制单元的输出u
i,3
和第i,3,2ADP子控制单元的输出d
i,3
;所述ADP偏航角姿态运算单元的输入端是ADP偏航角姿态逼近器单元的输出ADP偏航角姿态第i,3,1子控制单元的输入端分别是ADP偏航角姿态运算单元的输出和有向图中的拉普拉斯矩阵中的参数l
ii
和领导者的邻接通信b
i
;所述ADP偏航角姿态第i,3,2子控制单元的输入端分别是ADP偏航角姿态运算单元的输出和有向图中的拉普拉斯矩阵中的参数l
ii
和领导者的邻接通信b
i
;跟随者中第i个四旋翼无人机的系统模型为:其中,φ
i
为第i四旋翼无人机的滚转角、θ
i
为第i个四旋翼无人机的俯仰角、ψ
i
为第i四旋翼无人机的偏航角、ξ
φ,i
、ξ
θ,i
和ξ
ψ,i
表示第i个四旋翼无人机的空气动力阻尼系数、I
x,i
、I
y,i
和I
z,i
表示第i个四旋翼无人机的转动惯量、u
i,1
、u
i,2
和u
i,3
表示第i个四旋翼无人机的控制输入和d
i,1
、d
i,2
和d
i,3
表示第i个四旋翼无人机的外部未知扰动;将第i个四旋翼无人机的系统模型转换成状态模型,令x
i,1,1
=φ
i
,y
i,1

x
i,1,1
,x
i,2,1
=θ
i
,y
i,2
=x
i,2,1
,x
i,3,1
=ψ
i
,y
i,3
=x
i,3,1
,则转换后第i个四旋翼无人机的状态模型为:其中,y
i,1
为转换后第i个四旋翼无人机的输出滚转角,y
i,2
为转换后第i个四旋翼无人机的输出俯仰角,y
i,3
为转换后第i个四旋翼无人机的输出偏航角,x
i,1,1
、x
i,1,2
、x
i,2,1
、x
i,2,2
、x
i,3,1
和x
i,3,2
为第i个跟随者的状态,u
i,1
、u
i,2
和u
i,3
分别为第i个四旋翼无人机的滚转角控制输入、俯仰角控制输入和偏航角控制输入,d
i,1
、d
i,2
和d
i,3
分别为第i个四旋翼无人机的滚转角扰动、俯仰角扰动和偏航角扰动。2.根据权利要求1所述的多四旋翼无人机输出约束状态一致博弈控制器,其特征在于,将跟随者的邻接矩阵记为A,那么A=[a
i,j
]
N
×
N
,该邻接矩阵A=[a
i,j
]
N
×
N
的定义如下:其中,a
ij
为第i、j个跟随者的邻接通信;将有向图的拉普拉斯矩阵记为L,那么L=D

A,其中,D为有向图的度矩阵,且D=diag{d1,

,d
N
},d
i
为跟随者的邻接矩阵的行和,且3.根据权利要求1所述的多四旋翼无人机输出约束状态一致博弈控制器,其特征在于,将节点i的邻接集合定义为N
i
={j|(v
j
,v
i
)∈ε};有向图的拉普拉斯矩阵记为L,L=[l
i,j
]
N
×
N
,有向图的拉普拉斯矩阵L=[l
i,j
]
N
×
N
的定义为:其中,l
ij
为有向图的拉普拉斯矩阵中的元素。4.根据权利要求1所述的多四旋翼无人机输出约束状态一致博弈控制器,其特征在于,将领导者的邻接矩阵记为B,B=diag{b1,

,b
N
},其中b
i
为领导者的邻接通信,当第i个跟随者能够得到领导者的信号时,b
i
=1;当第i个跟随者不能得到领导者的信号时,b
i
=0。
5.一种基于权利要求1

4任一项所述多四旋翼无人机输出约束状态一致博弈控制器的设计方法,其特征在于,所述设计方法包括以下步骤:A、第i个跟随者的输出约束状态一致博弈控制器结构包括滚转角子控制器、俯仰角子控制器和偏航角子控制器,在第i个跟随者的输出约束状态一致博弈控制器中,设计滚转角子控制器;包括以下步骤:A1、设计滚转角姿态系统转换单元:滚转角姿态系统转换单元的输入端为第i个跟随者的状态x

【专利技术属性】
技术研发人员:杨杨范昕耿硕聪舒周岳东张腾飞
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1