一种基于元学习的无人艇轨迹跟踪控制器结构及控制方法技术

技术编号：40364867 阅读：4 留言：0更新日期：2024-02-20 22:12

本发明专利技术提供了一种基于元学习的无人艇轨迹跟踪控制器结构及控制方法，涉及无人艇轨迹跟踪控制技术领域，结构包括运动学控制器、动力学控制器、元学习预估器、学习的基函数和c个环境条件数据集；所述动力学控制器的输入端分别与运动学控制器、元学习预估器的输出端相连，所述动力学控制器的输出端分别与无人艇模型和c个环境条件数据集的输入端相连；所述元学习预估器的输入端分别与学习的基函数和无人艇模型的输出端相连，所述元学习预估器的输出端与所述动力学控制器的输入端相连；本发明专利技术用元学习技术精确刻画无人艇与环境交互过程中的复杂动态特征，形成有效的船舶模型特征和海洋环境特征知识表达，有效提高无人艇在不同环境下的适应性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及无人艇轨迹跟踪控制，具体而言，尤其涉及一种基于元学习的无人艇轨迹跟踪控制器结构及控制方法。

技术介绍

1、轨迹跟踪控制是无人艇运动控制问题中的一个基本问题，其控制目标为跟踪一条时变的参考轨迹，在指定时间内到达指定任务地点，有着严格的时间约束。与路径跟踪控制不同，轨迹跟踪控制需要同时满足时间约束和空间约束，常用于一些时间要求高的场景或任务中。由于无人艇航行时所处海洋环境复杂多变，存在大量的不确定性，这对无人艇轨迹跟踪控制产生了极大挑战。近年来，相关学者为降低和消除不确定性对无人艇轨迹跟踪控制性能的影响，提出了包含模糊控制、自适应控制以及自抗扰控制等方法。

2、现有关于无人艇轨迹跟踪控制方法，存在如下问题：第一，现有基于神经网络的无人艇轨迹跟踪控制方法主要采用浅层神经网络对不确定性进行逼近，由于其特征表达能力有限，难以精确刻画无人艇与环境交互过程中的复杂动态特性。第二，现有基于深度神经网络的无人艇轨迹跟踪控制方法由于深度网络训练的资源开销大，难以满足实时控制系统的实际应用。第三，现有基于预估器的无人艇轨迹跟踪控制方法无法精确刻画由不同海况引起的不确定性，难以形成不同海洋环境下的知识积累。

技术实现思路

1、有鉴于此，本专利技术的目的在于提出一种基于元学习的无人艇轨迹跟踪控制器结构及控制方法，利用元学习技术精确刻画无人艇与环境交互过程中的复杂动态特征，形成有效的船舶模型特征和海洋环境特征知识表达，有效提高无人艇在不同环境下的适应性。

2、本专利技术采用的技术手段如下：

3、一种基于元学习的无人艇轨迹跟踪控制器结构，包括运动学控制器、动力学控制器、元学习预估器、学习的基函数和c个环境条件数据集；

4、所述运动学控制器的输入端分别与给定的参考输入和无人艇模型的输出端相连，所述运动学控制器的输出端与动力学控制器的输入端相连；所述运动学控制器用以计算制导信号；

5、所述动力学控制器的输入端分别与运动学控制器、元学习预估器、学习的基函数以及无人艇模型的输出端相连，所述动力学控制器的输出端分别与无人艇模型和c个环境条件数据集的输入端相连；所述动力学控制器用以计算控制输入；

6、所述元学习预估器的输入端分别与学习的基函数和无人艇模型的输出端相连，所述元学习预估器的输出端与所述动力学控制器的输入端相连；所述元学习预估器用以计算建模误差的估计值和深度网络最后一层权重的估计值；

7、所述学习的基函数的输入端与c个环境条件数据集的输出端相连，所述学习的基函数的输出端分别与所述动力学控制器和元学习预估器的输入端相连；所述学习的基函数用以计算学习的基函数；

8、所述c个环境条件数据集的输入端分别与动力学控制器和无人艇模型的输出端相连，所述c个环境条件数据集的输出端与所述学习的基函数的输入端相连；所述c个环境条件数据集用以计算训练数据集；

9、进一步地，所述无人艇模型的公式为：

10、

11、其中，η＝[x,y,ψ]t∈r3为无人艇的位置和航向信息，[·]t表示向量的转置；ν＝[u,v,r]t∈r3为无人艇的速度信息；y(ν,τ)为由深度网络构建的基函数；为深度网络最后一层的权重，n为最后一层神经元数量；m∈r3×3为无人艇的惯性矩阵，m*∈r3×3为m的标定值；τ＝[τu,τv,τr]t∈r3为无人艇的控制输入；ε∈r为建模误差；r(ψ)∈r3×3为旋转矩阵。

12、进一步地，所述运动学控制器的输入信号为给定参考轨迹信号ηr和无人艇实际位置信息η，所述运动学控制器的输出信号为制导信号vg；

13、所述运动学控制器的公式为：

14、

15、其中，eη为运动学跟踪误差；k1c∈r3×3为对角增益矩阵；κ1∈r+为设计值。

16、进一步地，所述动力学控制器的输入信号为制导信号vg、无人艇实际速度信息ν、学习的基函数y(ν,τ)、建模误差的估计值和深度网络最后一层权重的估计值所述动力学控制器的输出信号为控制输入τ；

17、所述动力学控制器的公式为：

18、

19、其中，ev为动力学跟踪误差；为对角增益矩阵；κ2∈r+为设计值。

20、进一步地，所述c个环境条件数据集的输入信号为由c个不同环境下收集到的无人艇速度信息νc和控制输入τc，所述c个环境条件数据集的输出信号为训练数据集dc；

21、驱使无人艇执行随机动作并收集训练输入[νc,τc]，计算对应标签值定义训练数据集dc为：

22、

23、进一步地，所述学习的基函数的输入信号为训练数据集dc，输出信号为学习的基函数y(ν,τ)；

24、采用元学习方法训练深度网络。定义双层优化问题如下：

25、

26、内部优化问题用最小二乘法求解；外部优化问题用随机梯度下降方法求解，

27、内部优化问题为：

28、

29、外部优化问题为：

30、

31、其中，θc为第c个环境下的最优权重。

32、进一步地，所述元学习预估器的输入信号为无人艇实际速度信息ν和学习的基函数y(ν,τ)，所述元学习预估器的输出信号为建模误差的估计值和深度网络最后一层权重的估计值

33、所述元学习预估器的公式如下：

34、

35、其中，为无人艇实际速度信息ν的估计值；为无人艇速度估计偏差；λ1∈r、γε∈r、γθ∈r为设计参数；proj(·)为投影算子。

36、本专利技术还提供了一种基于元学习的无人艇轨迹跟踪控制器的控制方法，基于权利要求1-7中任一项权利要求所述的基于元学习的无人艇轨迹跟踪控制器结构实现，其特征在于，包括如下步骤：

37、收集c个不同环境条件下无人艇控制输入τc以及速度信息νc构建训练数据集dc；

38、利用训练数据集dc，训练深度网络得到学习的基函数y(ν,τ)；

39、元学习预估器根据学习的基函数y(ν,τ)、速度信息ν计算出建模误差的估计值和深度网络最后一层权重的估计值输出至动力学控制器；

40、给定参考轨迹信号ηr，运动学控制器根据参考轨迹信号ηr与无人艇实际位置信息η的偏差计算制导信号vg；

41、动力学控制器接收来自运动学控制器的制导信号vg、学习的基函数y(ν,τ)、无人艇实际速度信息ν、元学习预估器输出的建模误差的估计值和深度网络最后一层权重的估计值来计算控制输入τ；

42、将控制输入τ输入至无人艇模型，产生下一时刻的位置信息和速度信息，从而对被控无人艇进行控制。

43、较现有技术相比，本专利技术具有以下优点：

44、第一，与现有基于神经网络的无人艇轨迹跟踪控制方法相比，本专利技术采用元学习技术，利用深度神经网络建模不确定性，克服了浅层网络特征表达能力有限的缺点，实现了对无人艇与环境交互过程中的复本文档来自技高网...

【技术保护点】

1.一种基于元学习的无人艇轨迹跟踪控制器结构，其特征在于：包括运动学控制器、动力学控制器、元学习预估器、学习的基函数和c个环境条件数据集；

2.根据权利要求1所述的基于元学习的无人艇轨迹跟踪控制器结构，其特征在于，所述无人艇模型的公式为：

3.根据权利要求1所述的基于元学习的无人艇轨迹跟踪控制器结构，其特征在于，所述运动学控制器的输入信号为给定参考轨迹信号ηr和无人艇实际位置信息η，所述运动学控制器的输出信号为制导信号vg；

4.根据权利要求1所述的基于元学习的无人艇轨迹跟踪控制器结构，其特征在于，所述动力学控制器的输入信号为制导信号vg、无人艇实际速度信息ν、学习的基函数Y(ν,τ)、建模误差的估计值和深度网络最后一层权重的估计值所述动力学控制器的输出信号为控制输入τ；

5.根据权利要求1所述的基于元学习的无人艇轨迹跟踪控制器结构，其特征在于，所述c个环境条件数据集的输入信号为由c个不同环境下收集到的无人艇速度信息νc和控制输入τc，所述c个环境条件数据集的输出信号为训练数据集Dc；

6.根据权利要求1所述的基于元学习

7.根据权利要求1所述的基于元学习的无人艇轨迹跟踪控制器结构，其特征在于，所述元学习预估器的输入信号为无人艇实际速度信息ν和学习的基函数Y(ν,τ)，所述元学习预估器的输出信号为建模误差的估计值和深度网络最后一层权重的估计值

8.一种基于元学习的无人艇轨迹跟踪控制器的控制方法，基于权利要求1-7中任一项权利要求所述的基于元学习的无人艇轨迹跟踪控制器结构实现，其特征在于，包括如下步骤：

...

【技术特征摘要】

1.一种基于元学习的无人艇轨迹跟踪控制器结构，其特征在于：包括运动学控制器、动力学控制器、元学习预估器、学习的基函数和c个环境条件数据集；

2.根据权利要求1所述的基于元学习的无人艇轨迹跟踪控制器结构，其特征在于，所述无人艇模型的公式为：

4.根据权利要求1所述的基于元学习的无人艇轨迹跟踪控制器结构，其特征在于，所述动力学控制器的输入信号为制导信号vg、无人艇实际速度信息ν、学习的基函数y(ν,τ)、建模误差的估计值和深度网络最后一层权重的估计值所述动力学控制器的输出信号为控制输入τ；

5.根据权利要求1所述的基于元学习...

【专利技术属性】
技术研发人员：彭周华，夏枫倍，迟延瑜，古楠，刘陆，王浩亮，王安青，王丹，
申请(专利权)人：大连海事大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人