System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种无人艇预设时间节能运动控制方法技术_技高网

一种无人艇预设时间节能运动控制方法技术

技术编号:40340678 阅读:6 留言:0更新日期:2024-02-09 14:28
本申请公开了一种无人艇预设时间节能运动控制方法,涉及到无人艇的运动控制领域。本申请根据任务需要,建立无人艇系统模型,并给定期望轨迹;构造包含预设时间和精度的增广系统,并将其搭载于控制器中,使之与传感器进行数据获取与处理;设计一种考虑增广系统状态与控制输入的性能指标函数;鉴于HJB方程难以求解,采用积分强化学习算法近似求解最优控制策略;构造actor和critic权值更新律,将其搭载在硬件平台上,并搭建通讯架构;选取Lyapunov函数验证系统稳定性。本发明专利技术将预设时间控制理论编码到积分强化学习算法中,在保证系统稳定的同时,实现了无人艇在预设时间内以预设精度跟随期望轨迹的最优控制目标。

【技术实现步骤摘要】

本专利技术涉及无人艇运动控制领域,具体来说涉及一种无人艇预设时间节能运动控制方法


技术介绍

1、随着海洋事业的不断发展,无人艇作为一种无人水面平台凭借其高机动性、强环境适应性、可拓展性、低成本等众多优势,受到越来越多的广泛关注,并在侦查勘探、环境监测、生态保护、搜索救援、生态保护等领域发挥着举足轻重的作用。

2、在无人艇航行的过程中,其运动跟踪速度一定程度上影响着任务的实施效率。为了保证无人艇系统的稳定性和时效性,有限时间控制方法能够将系统的状态引导至期望值,但其收敛时间取决于初始条件,不具备快速收敛的能力;固定时间控制方法的目的在于保证系统的快速收敛性,打破依赖与初始条件的禁锢,但往往存在着时间高估与依赖参数设计等缺陷,难以直接人为调节。为了进一步提升固定时间控制的性能,预设时间控制应运而生。

3、需要指出的是,在使用预设时间控制得以加快系统收敛速度的同时,难免对无人艇施加更多的能量以保证控制精度和收敛时间,从而一定程度上增加控制成本与能源消耗,故综合考虑多项性能指标的优化控制至关重要。目前,优化控制主要有动态规划,最速下降法等方法,但动态规划算法在时间与空间上复杂度高,存在维数爆炸问题;最速下降法易陷入局部极小值,且难以获得最优解。由此可知,如何实现无人艇预设时间最优控制成为一大难点。

4、综上所述,亟需一种能够在预设时间内以低能耗、高精度实现无人艇指定跟踪精度的最优运动控制系统,使其在保证跟踪误差预期时间收敛的前提下,系统更加具有自主性与节能性。


技术实现思

1、为克服现有控制技术的不足,本专利技术实施例旨在提供无人艇预设时间节能运动控制方法,方法能够灵活选择所需跟踪时间和跟踪精度,减少对增广系统漂移动态的依赖,使得跟踪误差在预设时间里收敛到预定精度范围内,同时显著降低能源消耗,从而实现无人艇在预设时间内最优运动控制。

2、第一方面,本申请提供一种无人艇预设时间节能运动控制方法,所述方法包括以下步骤:

3、步骤1、根据系统特点与任务需求,建立无人艇系统模型,并给定期望轨迹;

4、步骤2、构造包含预设时间和精度的新型辅助函数,构建轨迹跟踪增广系统;

5、步骤3、根据增广系统状态与控制输入,构造综合考虑预设性能和控制成本的性能指标函数;

6、步骤4、采用积分强化学习算法近似求解最优控制策略;

7、步骤5、构造复合的自适应律更新actor-critic网络;

8、步骤6、构建lyapunov函数以验证系统的稳定性。

9、可选的,根据系统特点与任务需求,建立无人艇系统模型,并给定期望轨迹,包括:

10、步骤1-1、根据三自由度下无人艇在惯性坐标系和机体坐标系中的二维平面运动特点,运动学和动力学模型通过以下方法表示:

11、

12、其中,η=[x,y,ψ]t表示无人艇在惯性坐标系下的位置坐标及艏向,v=[u,ν,r]t表示无人艇在机体坐标系中对应纵荡、横荡以及艏摇这三个自由度下的线速度以及角速度;τ=[τu,τν,τr]t表示由螺旋桨产生的力与力矩,即控制输入;r(ψ)为惯性坐标系与机体坐标系之间的旋转矩阵,m=mt为质量惯性矩阵,c(v)为科里奥利和向心力矩阵,d(v)为阻尼矩阵,b=[b1,b2,b3]t表示外界产生的干扰力,且满足

13、步骤1-2、令f(η,v)=-m-1c(v)v-m-1d(v)v+m-1r(ψ)tb,则无人艇系统模型表示为如下形式:

14、

15、其中,f(η,v)为无人艇中存在的未知非线性项。

16、步骤1-3、在跟踪任务需求的基础上,给定期望轨迹为如下形式:

17、

18、其中,表示期望轨迹,ηd=[xd,yd,ψd]t,vd=[ud,νd,rd]t和fd(ηd,vd)分别表示期望的位姿、期望的速度以及期望的动态。

19、可选的,构造包含预设时间和精度的新型辅助函数,构建轨迹跟踪增广系统,包括:

20、步骤2-1、构造包括预设时间和精度的单调递减辅助函数:

21、

22、其中,t>0表示预设时间,表示预设精度。若无人艇的跟踪误差ηe在预设时间t内能够收敛到紧集内,则认为无人艇实现了预设时间运动控制。

23、步骤2-2、分别构造位姿、速度误差为ηe=[ex,ey,eψ]t和ve=[eu,eν,er]t,即ηe=η-ηd表示位置及艏向角误差,ve=v-vd表示速度及角速度误差。

24、步骤2-3、构造考虑预设时间和精度的误差转换函数ξη=[ξx,ξy,ξψ]t∈r3,其中,ξx=tan(πex/(2ζ)),ξy=tan(πey/(2ζ)),ξψ=tan(πeψ/(2ζ))分别为x轴、y轴、ψ自由度上转换后的位置误差及偏航角度误差,误差的初始值满足:|ex(0)|<ζ(0),ey(0)|<ζ(0),|eψ(0)|<ζ(0);

25、步骤2-4、那么与辅助函数相关的增广系统表示为如下形式:

26、

27、其中,为包含坐标变换函数、误差动态以及期望动态的增广系统状态。f矩阵与g矩阵记作:

28、

29、其中,

30、步骤2-5、将增广系统搭载于无人艇的控制器中,进行数据的获取与处理。

31、可选的,根据增广系统状态与控制输入,构造综合考虑预设性能和控制成本的性能指标函数,包括:

32、

33、其中,r(x,τ)=x(ω)tqx(ω)+τ(ω)trτ(ω)/t1为成本函数,q和r为对称正定矩阵,t1是一个参数,λ∈[0,1]为衰减因子。

34、可选的,采用积分强化学习算法近似求解最优控制策略,包括:

35、步骤4-1、hjb方程表示为如下形式:

36、

37、其中,表示性能指标函数v(x)关于增广系统状态x的偏导。

38、步骤4-2、定义最优性能指标函数:

39、

40、若控制策略τ是连续的,当τ能够使得无人艇系统稳定且收敛于集合ω,同时满足τ(0)=0和v(x)有限,则称控制策略τ可容许,即τ∈φ(ω)。

41、利用平稳性条件得最优控制输入为:

42、

43、步骤4-3、使用神经网络逼近性能指标函数v(x)和梯度▽vx,得:

44、

45、

46、其中,wc*t为权重因子,为基向量,表示近似误差,且满足和bεc和bεcx为正常数;鉴于wc*是未知的,故v(x)近似为:

47、

48、其中,是权重wc*的估计值,是性能指标函数v(x)的估计值。

49、步骤4-4、定义贝尔曼方程误差为:

50、

51、步骤4-5、使用第二个神经网络以保证系统的稳定性,即τ(x)改写为:...

【技术保护点】

1.一种无人艇预设时间节能运动控制方法,其特征在于,所述方法包括:

2.根据权利要求1所述的无人艇预设时间节能运动控制方法,其特征在于,根据系统特点与任务需求,建立无人艇系统模型,并给定期望轨迹,包括:

3.根据权利要求1所述的无人艇预设时间节能运动控制方法,其特征在于,构造包含预设时间和精度的新型辅助函数,构建轨迹跟踪增广系统,包括:

4.根据权利要求1所述的无人艇预设时间节能运动控制方法,其特征在于,根据增广系统状态与控制输入,构造综合考虑预设性能和控制成本的性能指标函数,包括:

5.根据权利要求1所述的无人艇预设时间节能运动控制方法,其特征在于,采用积分强化学习算法近似求解最优控制策略,包括:

6.根据权利要求1所述的无人艇预设时间节能运动控制方法,其特征在于,为自适应地找到最优性能函数与控制策略,设计critic和actor权值更新律,包括;

7.根据权利要求1所述的无人艇预设时间节能运动控制方法,其特征在于,构建Lyapunov函数如下:

【技术特征摘要】

1.一种无人艇预设时间节能运动控制方法,其特征在于,所述方法包括:

2.根据权利要求1所述的无人艇预设时间节能运动控制方法,其特征在于,根据系统特点与任务需求,建立无人艇系统模型,并给定期望轨迹,包括:

3.根据权利要求1所述的无人艇预设时间节能运动控制方法,其特征在于,构造包含预设时间和精度的新型辅助函数,构建轨迹跟踪增广系统,包括:

4.根据权利要求1所述的无人艇预设时间节能运动控制方法,其特征在于,根据增广系统状态与控制...

【专利技术属性】
技术研发人员:向峥嵘张燕吴婷孟宇航严鑫金东洋向雨竹
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1