一种双轴倾转矢量旋翼飞行器及其扰动补偿控制方法技术

技术编号:35991547 阅读:56 留言:0更新日期:2022-12-17 23:06
一种双轴倾转矢量旋翼飞行器及其扰动补偿控制方法,涉及飞行控制技术领域,针对现有技术中飞行器在调整姿态时,位置会因为姿态的变化而发生改变,即现有技术不能针对姿态和位置的耦合,实现解耦的问题,本申请通过机械结构的驱动,使旋翼机的每个旋翼可以独立的产生三维空间矢量推力,当采用的可倾转旋翼数量大于等于二时,旋翼飞行器的姿态控制与位置控制可以实现解耦,进一步提升旋翼飞行器的飞行能力,从而进一步扩展其应用场景。从而进一步扩展其应用场景。从而进一步扩展其应用场景。

【技术实现步骤摘要】
一种双轴倾转矢量旋翼飞行器及其扰动补偿控制方法


[0001]本专利技术涉及飞行控制
,具体为一种双轴倾转矢量旋翼飞行器及其扰动补偿控制方法。

技术介绍

[0002]旋翼飞行器因其出色的垂直起降能力、空中悬停能力,已经在航拍、植保、环境检测等领域发挥了巨大作用。然而,传统旋翼飞行器的姿态控制和位置控制存在耦合:在进行位置移动时,需要先调整姿态进而调整位置;而调整姿态时,位置会因为姿态的变化而发生改变。姿态和位置的耦合,导致旋翼飞行器在需要与外界进行接触交互时,存在一定的短板。

技术实现思路

[0003]本专利技术的目的是:针对现有技术中飞行器在调整姿态时,位置会因为姿态的变化而发生改变,即现有技术不能针对姿态和位置的耦合,实现解耦的问题,提出一种双轴倾转矢量旋翼飞行器及其扰动补偿控制方法。
[0004]本专利技术为了解决上述技术问题采取的技术方案是:
[0005]一种双轴倾转矢量旋翼飞行器,所述旋翼飞行器至少包括两个矢量推力产生结构;
[0006]所述矢量推力产生结构包括:第一驱动舵机1、舵机支撑结构2、第一舵机舵盘3、第一连接件4、矢量推力机臂5、第二连接件6、第二驱动舵机7、第二舵机舵盘8、第三舵机舵盘9、第三连接件10和第四连接件13;
[0007]所述矢量推力机臂5的一端通过第一连接件4与第一舵机舵盘3连接,所述第一舵机舵盘3与第一驱动舵机1连接,所述第一驱动舵机1通过舵机支撑结构2设置在机身上;
[0008]所述矢量推力机臂5的另一端通过第四连接件13和第二连接件6与第二舵机舵盘8和第三舵机舵盘9连接,所述第二舵机舵盘8和第三舵机舵盘9通过第三连接件10与旋翼连接;
[0009]所述矢量推力机臂5的轴向为x方向;
[0010]所述x方向垂直的方向为y方向;
[0011]所述第一舵机舵盘3产生x方向矢量力旋转;
[0012]所述第二驱动舵机7和第二舵机舵盘8产生y方向矢量力旋转。
[0013]进一步的,所述矢量推力产生结构还包括轴承11和轴承支撑结构12;
[0014]所述轴承11通过轴承支撑结构12设置在矢量推力机臂5上。
[0015]一种双轴倾转矢量旋翼飞行器的扰动补偿控制方法,包括以下步骤:
[0016]步骤一:对飞行器进行动力学建模,得到动力学模型;
[0017]步骤二:根据动力学模型设计位置环基础控制器和姿态环基础控制器,并得到位置环基础控制器的输出和姿态环基础控制器的输出;
[0018]步骤三:设计位置环的扰动力补偿器和姿态环的扰动力补偿器,并得到位置环的扰动力补偿器的输出以及姿态环的扰动力补偿器的输出;
[0019]步骤四:将位置环基础控制器的输出、姿态环基础控制器的输出、位置环的扰动力补偿器的输出以及姿态环的扰动力补偿器的输出进行结合,进而得到每个舵机的转角和无刷电机提供的推力数值大小。
[0020]进一步的,所述动力学模型表示为:
[0021][0022][0023]其中,m
b
为飞行器的质量,J
b
为飞行器的惯性张量,f
a
,f
g
,f
dis
分别为气动力、重力、扰动力,t
a
,t
g
,t
dis
分别为气动力矩、重力力矩、扰动力矩,为实时加速度,ω
b
为实时角速度,为实时角加速度。
[0024]进一步的,所述步骤二的具体步骤为:
[0025]忽略扰动力f
dis
和扰动力矩t
dis
,根据动力学模型设计位置环和姿态换基础控制器,得到位置环基础控制器的输出f
b
和姿态环基础控制器的输出t
b

[0026]进一步的,所述位置环的扰动力补偿器设计步骤如下:
[0027]步骤1:定义深度强化学习状态量:e
p
,u分别对应该位置通道位置偏差、速度、加速度、控制器输出;
[0028]步骤2:定义深度强化学习奖励函数:
[0029][0030]其中,i
t
为单次训练的步数长度,训练过程中,设置训练停止条件,|e
p
|>5,即满足停止条件时停止本轮训练,开始下一轮训练,k1,k2,k3为根据|e
p
|设置的系数,k1,k2,k3规则如下:
[0031][0032]步骤3:根据深度强化学习状态量以及深度强化学习奖励函数选择适用于连续状
态空间和连续动作空间的深度强化学习方法进行训练,得到智能体,即扰动力补偿器。
[0033]进一步的,所述姿态环的扰动力补偿器设计步骤如下:
[0034]步骤A:定义深度强化学习训练的状态量:
[0035][0036]其中,q
e1
,q
e2
,q
e3
,q
e4
为姿态偏差的四元数为下的各元素,满足
[0037]q
e
为姿态四元数偏差,q
t
为期望姿态四元数,为机体姿态四元数的共轭,ω1,ω2,ω3为机体角速度的各元素,满足ω
b
=[ω
1 ω
2 ω3],为机体角加速度的各元素,满足m1,m2,m3为已知力矩总和的各元素,满足t
a

ω
b
×
J
b
ω
b
=[m
1 m
2 m3];
[0038]步骤B:定义深度强化学习奖励函数:
[0039][0040]其中,i
t
为单次训练的步数长度,L=||q
e

[1 0 0 0]||2为姿态偏差四元数为同单位四元数的差的二范数,当姿态无偏差时,q
e
=[1 0 0 0],k4,k5为根据L设置的系数,k4,k5规则如下:
[0041][0042]L=||q
e

[1 0 0 0]||2[0043]步骤C:根据深度强化学习训练的状态量和深度强化学习奖励函数选择适用于连续状态空间和连续动作空间的深度强化学习方法进行训练,得到智能体,即扰动力补偿器。
[0044]进一步的,所述深度强化学习方法为PPO或DDPG。
[0045]进一步的,所述步骤四的具体步骤为:
[0046]将位置环基础控制器的输出、姿态环基础控制器的输出、位置环的扰动力补偿器的输出以及姿态环的扰动力补偿器的输出进行结合,得到期望的气动力和气动力矩,所述期望的气动力和气动力矩表示为:
[0047]f
a
=f
b
+f
c
[0048]t
a
=t
b
+t
c
[0049]其中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种双轴倾转矢量旋翼飞行器,其特征在于所述旋翼飞行器至少包括两个矢量推力产生结构;所述矢量推力产生结构包括:第一驱动舵机(1)、舵机支撑结构(2)、第一舵机舵盘(3)、第一连接件(4)、矢量推力机臂(5)、第二连接件(6)、第二驱动舵机(7)、第二舵机舵盘(8)、第三舵机舵盘(9)、第三连接件(10)和第四连接件(13);所述矢量推力机臂(5)的一端通过第一连接件(4)与第一舵机舵盘(3)连接,所述第一舵机舵盘(3)与第一驱动舵机(1)连接,所述第一驱动舵机(1)通过舵机支撑结构(2)设置在机身上;所述矢量推力机臂(5)的另一端通过第四连接件(13)和第二连接件(6)与第二舵机舵盘(8)和第三舵机舵盘(9)连接,所述第二舵机舵盘(8)和第三舵机舵盘(9)通过第三连接件(10)与旋翼连接;所述矢量推力机臂(5)的轴向为x方向;所述x方向垂直的方向为y方向;所述第一舵机舵盘(3)产生x方向矢量力旋转;所述第二驱动舵机(7)和第二舵机舵盘(8)产生y方向矢量力旋转。2.根据权利要求1所述的一种双轴倾转矢量旋翼飞行器,其特征在于所述矢量推力产生结构还包括轴承(11)和轴承支撑结构(12);所述轴承(11)通过轴承支撑结构(12)设置在矢量推力机臂(5)上。3.基于权利要求1所述的一种双轴倾转矢量旋翼飞行器的扰动补偿控制方法,其特征在于包括以下步骤:步骤一:对飞行器进行动力学建模,得到动力学模型;步骤二:根据动力学模型设计位置环基础控制器和姿态环基础控制器,并得到位置环基础控制器的输出和姿态环基础控制器的输出;步骤三:设计位置环的扰动力补偿器和姿态环的扰动力补偿器,并得到位置环的扰动力补偿器的输出以及姿态环的扰动力补偿器的输出;步骤四:将位置环基础控制器的输出、姿态环基础控制器的输出、位置环的扰动力补偿器的输出以及姿态环的扰动力补偿器的输出进行结合,进而得到每个舵机的转角和无刷电机提供的推力数值大小。4.根据权利要求3所述的一种双轴倾转矢量旋翼飞行器的扰动补偿控制方法,其特征在于所述动力学模型表示为:在于所述动力学模型表示为:其中,m
b
为飞行器的质量,J
b
为飞行器的惯性张量,f
a
,f
g
,f
dis
分别为气动力、重力、扰动力,t
a
,t
g
,t
dis
分别为气动力矩、重力力矩、扰动力矩,为实时加速度,ω
b
为实时角速度,为实时角加速度。5.根据权利要求4所述的一种双轴倾转矢量旋翼飞行器的扰动补偿控制方法,其特征在于所述步骤二的具体步骤为:忽略扰动力f
dis
和扰动力矩t
dis
,根据动力学模型设计位置环和姿态换基础控制器,得
到位置环基础控制器的输出f
b
和姿态环基础控制器的输出t
b
。6.根据权利要求5所述的一种双轴倾转矢量旋翼飞行器的扰动补偿控制方法,其特征在于所述位置环的扰动力补偿器设计步骤如下:步骤1:定义深度强化学习状态量:e
p
,u分别对应该位置通道位置偏差、速度、加速度、控制器输出;步骤2:定义深度强化学习奖励函数:其中,i
t
为单次训练的步数长度,训练过程中,设置训练停止条件,|e
p
|>5,即满足停止条件时停止本轮训练,开始下一轮训练,k1,k2,k3为根据|e
p
|设置的系数,k1,k2,k3规则如下:步骤3:根据深度强化学习状态量以及深度强化学习奖励函数选择适用于连续状态空间和连续动作空间的深度强化学习方法进行训练,得到智能...

【专利技术属性】
技术研发人员:李湛杨义鹏于兴虎高会军
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1