【技术实现步骤摘要】
一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法
本专利技术涉及强化学习与水面无人船的轨迹跟踪
,具体而言,尤其涉及一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法。
技术介绍
水面无人船是具有自主导航能力,并且可自主实现环境感知、目标探测等任务的智能化、无人化水面平台,其最主要的特征便是欠驱动性,即利用两个独立的输入端同时控制三个自由渡的运动;欠驱动系统能够通过较少的驱动器来完成复杂的控制任务,不仅能够降低成本,简化控制系统结构,同事也能提高系统的可靠性与易维护性;但是在对水面无人船的跟踪控制方面仍然存在一些问题,例如:当外界存在较大的风浪流等干扰时,控制器需要较大的值来克服干扰。但当控制器中存在饱和特性时,往往不能达到控制要求,因此需要考虑在控制器存在饱和时的轨迹跟踪控制问题。
技术实现思路
根据上述提出的技术问题,而提供一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法。本专利技术考虑了控制器存在输入饱和限制,当外界干扰过大时,控制器不会因为输入饱和特性使得跟踪效果变差 ...
【技术保护点】
1.一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法,其特征在于,所述方法包括:/n建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;/n基于设定的期望轨迹数学模型,引入控制器输入饱和函数;/n基于引入控制器输入饱和函数的期望轨迹数学模型,设计无人船控制率;/n基于设计的无人船控制率,设计神经网络权重更新率。/n
【技术特征摘要】
1.一种具有输入饱和受限的无人船强化学习自适应跟踪控制方法,其特征在于,所述方法包括:
建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;
基于设定的期望轨迹数学模型,引入控制器输入饱和函数;
基于引入控制器输入饱和函数的期望轨迹数学模型,设计无人船控制率;
基于设计的无人船控制率,设计神经网络权重更新率。
2.根据权利要求1所述的具有输入饱和受限的无人船强化学习自适应跟踪控制方法,其特征在于,所述建立无人水面船数学模型,设定无人水面船的期望轨迹数学模型;包括:
定义北东坐标系OX0Y0Z0和附体坐标系BXYZ两个坐标系;
将北东坐标系(OX0Y0Z0)视作惯性坐标系,取地球任一点O为坐标原点,OX0指向正北,OY0指向正东,OZ0指向地球球心;
将附体坐标系BXYZ视作非惯性坐标系,船舶左右对称时,取其中心为坐标原点B,BX轴沿着船舶中线指向船艏方向,BY轴垂直指向右舷,BZ轴沿XY平面垂直指向下;
对无人水面船进行建模,得到如下船舶运动控制数学模型:
其中,η=[x,y,ψ]T表示北东坐标系下的船舶位置向量,x、y表示无人水面船运动的北东位置,ψ∈[0,2π]表示艏摇角;R(ψ)表示地球坐标系和船体坐标系之间的转换矩阵;ν=[u,v,r]T表示附体坐标系下无人水面船运动的速度向量,u、v、r分别表示其纵荡速度、横荡速度、艏摇速度;τ′=M-1τ,τ=[τu,τv,τr]T表示船舶控制输入向量,τu、τv、τr分别表示纵荡控制力、横荡控制力、艏摇控制力;f(v)表示系统动态向量,f(v)=-M-1(C(v)v+D(v)v),M(t)=MT(t)>0表示包含附加质量的惯性矩阵,C(v)表示斜对称矩阵,D(v)表示阻尼矩阵;
设定无人水面船的期望轨迹数学模型如下:
其中,xd=[ηdT,vdT]T,ηd=[xd,yd,ψd]T和νd=[ud,vd,rd]T分别是无人水面船跟踪的期望位置向量及速度向量。
3.根据权利要求1所述的具有输入饱和受限的无人船强化学习自适应跟踪控制方法,其特征在于,所述基于设定的期望轨迹数学模型,引入控制器输入饱和函数,包括:
引入控制器输入饱和函数,其表达式如下:
其中,μi表示控制输入;τi,M是τi的界,τi表示具有饱和特性的控制输入;sat(μi)是μi...
【专利技术属性】
技术研发人员:王宁,李堃,高颖,沈士为,杨忱,薛皓原,
申请(专利权)人:大连海事大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。