一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质技术

技术编号:34804957 阅读:42 留言:0更新日期:2022-09-03 20:12
本发明专利技术提出一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质。模型预测控制在处理多臂航天器这类具有多种约束的复杂非线性系统方面具有优良的性能,并且被广泛地应用于地面机器人、无人机、自动驾驶等实际场景中。因此本发明专利技术基于模型预测控制进行任务空间控制器设计。此外,为了增强其抗干扰能力,利用高斯混合过程训练数据量小、训练速度快的特点,建立干扰模型并在模型预测控制中进行补偿。最后设计了推力分配方法完成平台控制。本发明专利技术提出的方法设计方便直观,具有较强的实用性。的实用性。的实用性。

【技术实现步骤摘要】
一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质


[0001]本专利技术属于在轨服务、航天器控制、模型预测控制
,特别是涉及一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质。

技术介绍

[0002]近年来,在轨服务技术得到了世界各国的广泛重视,中国、美国、欧空局、日本等主要航天机构开展了大量地面和空间试验,实现了卫星捕获、燃料加注、部件更换、空间碎片清理等多种类型的在轨服务任务。但是,航天器在轨服务任务都是在任务空间/笛卡尔空间描述,而传统控制器设计大多在关节空间进行表达,需要额外进行逆运动学的解算,直观性欠缺的同时,存在控制能力不匹配、计算量大等问题。因此,本专利技术基于模型预测控制(Model Predictive Control,MPC),提出了一种简便、直接、适用于处理多臂航天器高维非线性模型的任务空间控制器设计方法。
[0003]同时,在轨服务航天器航天器在地面进行实验和空间执行任务的过程中存在多种扰动,包括参数不确定性、空间环境力矩扰动、输入和量测噪声等,对在轨服务任务的性能影响明显。传统解决方法各有优劣:基于鲁棒性设计的方法需要假设总扰动存在上界;基于自适应、干扰观测器的方法能够在线估计扰动,但是对初值要求较高,初始时刻性能差;基于神经网络、模糊网络构造扰动模型的方法需要离线训练,初始性能较好但是对训练数据量有要求。考虑到在轨服务航天器的实际工作流程,利用高斯混合过程(the Mixture of Gaussian Processes,MGP)设计一种数据量需求小、训练速度快的离线扰动模型构造方法具有良好的应用前景。
[0004]最后,传统在轨服务航天器一般为自由漂浮模式,不对卫星平台进行控制,或者仅依赖飞轮进行平台姿态调节,机动能力较弱,工作范围较小,影响在轨服务的效率和性能。针对这一问题,本专利技术采用喷气推力器对航天器平台位姿进行调节,并设计了相应的推力器控制分配方法。

技术实现思路

[0005]本专利技术目的是针对现有多臂航天器控制方法的不足,提出了一种基于高斯混合过程的多臂航天器模型预测控制方法、设备和介质。
[0006]本专利技术是通过以下技术方案实现的,本专利技术提出一种基于高斯混合过程的多臂航天器模型预测控制方法,具体包括:
[0007]建立多臂航天器动力学和运动学模型,作为MPC中的预测模型;
[0008]对于预测模型中的扰动项估计值输入初始激励建立数据集,利用高斯混合过程训练得到多臂航天器的残差动力学作为扰动项的估计值;
[0009]根据实际驱动器输入饱和约束,构建模型预测控制器,实现多臂航天器机械臂末端和平台位姿对期望轨迹的跟踪,所述饱和包括关节电机饱和和平台推力器推力饱和;
[0010]所述平台推力器为开关控制模式,将MPC产生的平台连续控制指令分配为每个推力器的开机时间,得到最终的推力器驱动指令。
[0011]进一步地,对于拥有n条机械臂,每条臂拥有m个自由度,平台配置l个喷气推力器的多臂航天器,首先在关节空间对多臂航天器的动力学模型进行描述:
[0012]多臂航天器动力学模型表示为:
[0013][0014]其中,M代表多臂航天器的惯性参数;C代表非线性项;d是扰动项;代表平台位姿和关节角度信息,r0为6自由度平台位姿,q=[q1,

,q
n
]T
为关节角度;代表控制力和控制力矩,F0代表平台控制力/力矩,F
q
代表关节力矩。
[0015]进一步地,根据机械臂末端与关节、平台状态的映射关系,利用DH参数法得到在轨服务航天器末端位姿的描述形式:
[0016][0017]其中,齐次变换矩阵通过DH参数θ
m
,d
m
,a
m

m
进行定义:
[0018][0019]最后,构建状态空间表达式:
[0020][0021]其中,代表平台和机械臂末端位姿,代表扰动项的估计值;
[0022]设定采样时间Δt,将连续的状态空间表达式转化为离散时间模型,在当前k时刻测量值的基础上实现对未来k+N时刻系统状态的预测:
[0023][0024]进一步地,记录得到p组数据集进行高斯混合过程训练,其中输入x包含多臂航天器位姿Q、速度和控制量的增量Δu,输出y为实际角速度和名义模型计算角加速度的差值,即残差动力学,用于捕捉总扰动对系统的影响
[0025]高斯过程事先假设样本服从高斯分布:
[0026]y(x)~N(μ(x),k(x,x'))
ꢀꢀ
(6)
[0027]其中,μ(x)代表均值函数;k(x,x')代表协方差函数,表达式为:
[0028][0029]其中,σ
n
取0.3,σ
f
,l为待求解的超参数,
[0030]采用优化最大似然估计的方法对协方差函数进行求解:
[0031][0032]训练得到高斯过程的超参数之后,即可利用预测点的输入信息x
*
来求解对应的输出值y
*
;先确定样本和测试集的联合概率密度函数:
[0033][0034]其中,
[0035]K
**
=k(x
*
,x
*
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0036]K
*
=[k(x
*
,x1) k(x
*
,x2)
ꢀ…ꢀ
k(x
*
,x
p
)]ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0037][0038]利用贝叶斯推理,得到预测点的后验概率表达式:
[0039]y
*
|y(x)~N(K
*
K
‑1y,K
**

K
*
K
‑1K
*T
)
ꢀꢀ
(13)
[0040]得到高斯过程的预测值:
[0041][0042]进一步地,在所述多臂航天器高斯过程中利用局部高斯过程方法,所述局部高斯过程方法为:先根据高斯混合模型方法进行聚类,再针对每一个高斯分量进行回归,最后在预测时对局部预测值进行融合;
[0043]假设输入x服从M个高斯分量的混合分布,其概率密度分布函数为:
[0044][0045]其中,π
i
为混合系数,代表样本来源于第i个高斯分量的概率;p(x|μ
i

i
)代表由第i个高斯分量生成样本的概率;{μ
i

i
}为高斯混合过程的超参数。
[0046]进一步地,在得到训练样本后,首先对模型参数进行初始化,然后通过期望最大化算法的E步骤和M步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于高斯混合过程的多臂航天器模型预测控制方法,其特征在于,具体包括:建立多臂航天器动力学和运动学模型,作为MPC中的预测模型;对于预测模型中的扰动项估计值输入初始激励建立数据集,利用高斯混合过程训练得到多臂航天器的残差动力学作为扰动项的估计值;根据实际驱动器输入饱和约束,构建模型预测控制器,实现航天器机械臂末端和平台位姿对期望轨迹的跟踪,所述饱和包括关节电机饱和和平台推力器推力饱和;所述平台推力器为开关控制模式,将MPC产生的平台连续控制指令分配为每个推力器的开机时间,得到最终的推力器驱动指令。2.根据权利要求1所述的方法,其特征在于,对于拥有n条机械臂,每条臂拥有m个自由度,平台配置l个喷气推力器的多臂航天器,首先在关节空间对多臂航天器的动力学模型进行描述:多臂航天器动力学模型表示为:其中,M代表多臂航天器的惯性参数;C代表非线性项;d是扰动项;代表平台位姿和关节角度信息,r0为6自由度平台位姿,q=[q1,

,q
n
]
T
为关节角度;代表控制力和控制力矩,F0代表平台控制力/力矩,F
q
代表关节力矩。3.根据权利要求2所述的方法,其特征在于,根据机械臂末端与关节、平台状态的映射关系,利用DH参数法得到多臂航天器机械臂末端位姿的描述形式:其中,齐次变换矩阵通过DH参数θ
m
,d
m
,a
m

m
进行定义:最后,构建状态空间表达式:其中,代表平台和机械臂末端位姿,代表扰动项的估计值;设定采样时间Δt,将连续的状态空间表达式转化为离散时间模型,在当前k时刻测量值的基础上实现对未来k+N时刻系统状态的预测:
4.根据权利要求3所述的方法,其特征在于,记录得到p组数据集进行高斯混合过程训练,其中输入x包含多臂航天器位姿Q、速度和控制量的增量Δu,输出y为实际角速度和名义模型计算角加速度的差值,即残差动力学,用于捕捉总扰动对系统的影响高斯过程事先假设样本服从高斯分布:y(x)~N(μ(x),k(x,x'))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中,μ(x)代表均值函数;k(x,x')代表协方差函数,表达式为:其中,σ
n
取0.3,σ
f
,l为待求解的超参数,采用优化最大似然估计的方法对协方差函数进行求解:训练得到高斯过程的超参数之后,即可利用预测点的输入信息x
*
来求解对应的输出值y
*
;先确定样本和测试集的联合概率密度函数:其中,K
**
=k(x
*
,x
*
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)K
*
=[k(x
*
,x1)k(x
*
,x2)

k(x
*
,x
p
)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)利用贝叶斯推理,得到预测点的后验概率表达式:得到高斯过程的预测值:5.根据权利要求4所述的方法,其特征在于,在所述多臂航天器高斯过程中利用局部高斯过程方法,所述局部高斯过程方法为:先根据高斯混合模型方法进行聚类,再针对每一个高斯分量进行回归,最后在预测时对局部预测值进行融合;假设输入x服从M个高斯分量的混合分布,其概率密度分布函数为:
其中,π
i
为混合系数,代表样本来源于第i个高斯分量的概率;p(x|μ
i

i
)代表由第...

【专利技术属性】
技术研发人员:岳程斐曹喜滨柳子然陈雪芹吴凡魏承
申请(专利权)人:哈尔滨工业大学深圳
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1