当前位置: 首页 > 专利查询>东南大学专利>正文

一种空间机器人高斯过程轨迹跟踪控制方法技术

技术编号:27283600 阅读:58 留言:0更新日期:2021-02-06 11:51
本发明专利技术公开了一种空间机器人高斯过程轨迹跟踪控制方法,对空间机器人系统动力学模型进行在线辨识,同时利用模型置信度动态地调整控制增益。进一步地,对高斯过程动力学模型的在线训练采用基于引导数据点的稀疏化方法,同时采用一种边缘粒子滤波器对高斯过程模型的超参数进行在线估计,有效地减小了模型训练和预测的计算负担。预测的计算负担。

【技术实现步骤摘要】
一种空间机器人高斯过程轨迹跟踪控制方法


[0001]本专利技术涉及轨迹跟踪控制
,特别涉及一种空间机器人高斯过程轨迹跟踪控制方法。

技术介绍

[0002]在空间探索计划中,空间机器人的应用能够帮助人类完成十分危险而困难的工作。在空间站在轨装配、维护维修等任务中,空间机器人都扮演着十分重要的角色。空间机器人的轨迹跟踪控制是空间机器人应用中的一项重要技术。随着系统辨识理论和控制理论的不断发展,基于数据和机器学习的控制方法不断提出,大大提高了在系统模型未知情况下的轨迹跟踪控制性能。
[0003]《面向模型未知的自由漂浮空间机械臂自适应神经鲁棒控制》,载于《中国工程机械学报》(王超,蒋理剑,叶晓平,蒋黎红,and张文辉,"面向模型未知的自由漂浮空间机械臂自适应神经鲁棒控制,"中国工程机械学报,vol.17,pp.153-158,2019.)公开了一种基于神经网络模型的空间机器人轨迹跟踪控制方法,使用径向基神经网络对机器人动力学模型中的未知部分进行逼近,设计鲁棒控制器对逼近误差和外界干扰进行补偿。然而,该方法与其他类似使用神经网络进行轨迹跟踪控制律设计的方法存在一定问题,包括模型可解释性差、模型置信度难以评估、需要大量训练数据等。
[0004]高斯过程是一种非参数化的机器学习模型,与神经网络相比,高斯过程模型预测中得到的后验协方差可以作为模型准确度的度量,灵活运用在模型应用中,具备天生的优势。同时,训练高斯过程模型所需的数据也相对较少。《Stable gaussian process based tracking control of euler

lagrange systems》,载于《Automatica》(T.Beckers,D.and S.Hirche,"Stable gaussian process based tracking control of euler

lagrange systems,"Automatica,vol.103,pp.390-397,2019.)中公开了一种基于高斯过程的欧拉-拉格朗日系统轨迹跟踪方法,使用高斯过程模型对系统未知动力学进行拟合,结合传统的计算转矩控制方法,取得了较好的控制效果。然而,使用原始的高斯过程方法计算复杂度较高,而且该方法基于离线学习,无法应对环境的变化。
[0005]稀疏在线高斯过程是高斯过程技术的延展,是解决上述两个问题的途径。《Variational learning of inducing variables in sparse Gaussian processes》,载于会议《Artificial Intelligence and Statistics》(M.Titsias,"Variational learning of inducing variables in sparse Gaussian processes,"in Artificial Intelligence and Statistics,2009,pp.567-574.)公开了一种基于引导输入点的稀疏高斯过程方法,用引导点值归纳训练数据中的信息,大大提高了高斯过程方法的计算效率;《A marginalized particle Gaussian process regression》,载于会议《Advances in Neural Information Processing Systems》(Y.Wang and B.Chaib-draa,"A marginalized particle Gaussian process regression,"in Advances in Neural Information Processing Systems,2012,pp.1187-1195.)公开了一种在线高斯过程技术,
基于边缘粒子滤波器技术对高斯过程模型进行在线更新。然而这些技术都限于算法上的改进,缺乏与实际应用的结合。
[0006]现有的空间机器人轨迹跟踪控制方法中,基于模型的方法受限于动力学模型的准确度,基于数据的方法则大多面临无法衡量模型置信度的问题。目前尚没有能够较好地应用诸如高斯过程模型此类的非参数化贝叶斯机器学习方法的轨迹跟踪控制方法出现。

技术实现思路

[0007]本专利技术的目的是提供一种准确有效的、能够评估模型置信度、能够实现在线更新且计算效率较高的空间机器人轨迹跟踪控制方法。
[0008]为了实现上述目的,本专利技术的技术方案如下:一种空间机器人高斯过程轨迹跟踪控制方法,该方法包括以下步骤:
[0009]步骤(1)基于稀疏化的高斯过程模型,对空间机器人系统动力学模型进行辨识;
[0010]步骤(2)将所辨识的系统与计算转矩控制方法相结合,得到高斯过程控制律;
[0011]步骤(3)在控制过程中,基于边缘粒子滤波器方法根据实时得到的数据对系统模型进行在线更新。
[0012]进一步地,所述步骤(1)包括:
[0013](11)建立动力学模型,设定高斯过程模型输入输出
[0014]空间机器人的动力学模型为
[0015][0016]其中为机器人系统广义变量,u(t)为控制输入,f(p)为无法精确建模的未知动力学影响,M(q)为广义惯量矩阵,为广义科氏力矩阵,均为无法准确得到的模型参数;令空间机器人动力学系统的估计模型为
[0017][0018]选择作为高斯过程模型输入变量,选择
[0019][0020]作为待辨识的高斯过程模型输出,代表模型误差,
[0021](12)获取训练数据
[0022]在输入空间内随机选取训练输入P=[p1,

,p
N
],选取任意一种控制律u,测量系统各阶广义变量,得到训练数据输出H=[h(p1),...,h(p
N
)]=[h1,...,h
D
]T

[0023](13)给定高斯过程先验模型
[0024]对系统模型误差函数的各个维度使用独立的高斯过程进行建模,考虑系统模型误差函数h(p)的其中一个维度h
d
(p),给定其高斯过程先验为
[0025][0026]其中m
d
(p)为均值函数,k
d
(p,p')为协方差函数。
[0027](14)高斯过程稀疏化处理
[0028]采用基于引导点的稀疏化方法,对模型误差函数h
d
(p),令其引导输入为Z
d
=[z
d,1
,

,z
d,M
],引导点值为u
d
=[h
d
(z
d,1
),

,h
d
(z
d,M
)]T

[0029](15)超参数训练
[0030]通过训练数据的似本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种空间机器人高斯过程轨迹跟踪控制方法,其特征在于,所述方法包括以下步骤:步骤(1)基于稀疏化的高斯过程模型,对空间机器人系统动力学模型进行辨识;步骤(2)将所辨识的系统与计算转矩控制方法相结合,得到高斯过程控制律;步骤(3)在控制过程中,基于边缘粒子滤波器方法根据实时得到的数据对系统模型进行在线更新。2.根据权利要求1所述的空间机器人高斯过程轨迹跟踪控制方法,其特征在于,所述步骤(1)包括:(11)建立动力学模型,设定高斯过程模型输入输出空间机器人的动力学模型为其中为机器人系统广义变量,u(t)为控制输入,f(p)为无法精确建模的未知动力学影响,M(q)为广义惯量矩阵,为广义科氏力矩阵,均为无法准确得到的模型参数,令空间机器人动力学系统的估计模型为选择作为高斯过程模型输入变量,选择作为待辨识的高斯过程模型输出,代表模型误差,(12)获取训练数据在输入空间内随机选取训练输入P=[p1,

,p
N
],选取任意一种控制律u,测量系统各阶广义变量,得到训练数据输出(13)给定高斯过程先验模型对系统模型误差函数的各个维度使用独立的高斯过程进行建模,考虑系统模型误差函数h(p)的其中一个维度h
d
(p),给定其高斯过程先验为其中m
d
(p)为均值函数,k
d
(p,p')为协方差函数;(14)高斯过程稀疏化处理采用基于引导点的稀疏化方法,对模型误差函数h
d
(p),令其引导输入为Z
d
=[z
d,1
,

,z
d,M
],引导点值为(15)超参数训练通过训练数据的似然对高斯过程模型超参数进行训练,得到最优超参数为式中最大化的似然函数为
其中K
uu
=K(Z
d
,Z
d
)和K
uh
=K(Z
d
,P)为协方差矩阵,其元素根据协方差函数得到,(16)获得高斯过程后验模型根据训练数据和优化后的超参数,对待辨识的输入点p
*
得到其高斯过程后验分布其均值和方差为其均值和方差为其中m
d,*
=m
d
(p
*
),),为协方差向量;(17)整合各维度均值和协方差整合系统误差函数各维度均值和协方差为和进一步地,使用P和Z前D维度,得到模型误差函数的后验比例边际协方差Σ
p
(q
*
),使用P和Z前2D维度,得到模型误差函数的后验...

【专利技术属性】
技术研发人员:符启恩孙长银陆科林
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1