面向多水面自主航行器会遇局面的航行决策方法及系统技术方案

技术编号:39055469 阅读:11 留言:0更新日期:2023-10-12 19:48
本发明专利技术公开了一种面向多水面自主航行器会遇局面的航行决策方法及系统,涉及水面自主航行器自主避障技术领域,该方法包括:建立水面自主航行器运动模型和水面自主航行器领域模型;根据所述水面自主航行器运动模型和所述水面自主航行器领域模型确定当前水面自主航行器位置坐标;构建针对多水面自主航行器会遇局面下的航行决策判定方式;通过历史数据训练RG

【技术实现步骤摘要】
面向多水面自主航行器会遇局面的航行决策方法及系统


[0001]本专利技术涉及水面自主航行器自主避障
,特别涉及一种面向多水面自主航行器会遇局面的航行决策方法及系统。

技术介绍

[0002]随着人工智能技术的发展以及海上交通情况的日益复杂化,水面自主航行器自主避障决策方法被视为海洋工程领域待解决的重要问题之一。自主避障方法是一种可以在没有人类控制的情况下,让水面自主航行器在航行过程中自主避让其他水面自主航行器和障碍物的智能方法。该方法不仅需要满足航行器与静态障碍物的避碰,还要考虑到在运动过程中,航行器与航行器之间的避碰问题。
[0003]传统的无人航行器避障决策方法主要是通过数理模型或启发式搜索的方式让无人航行器进行避障决策。这其中包括改进的A星算法,人工势场法,粒子群算法,速度障碍物算法等。然而这些算法在面对复杂环境时存在计算实时性较差、容易陷入局部最优点,以及不具备对环境的适应与学习能力。

技术实现思路

[0004]本专利技术的目的是提供一种面向多水面自主航行器会遇局面的航行决策方法及系统,实现在复杂水域中多水面自主航行器的避障决策。
[0005]为实现上述目的,本专利技术提供了如下方案:
[0006]一种面向多水面自主航行器会遇局面的航行决策方法,包括:
[0007]建立水面自主航行器运动模型和水面自主航行器领域模型;
[0008]根据所述水面自主航行器运动模型和所述水面自主航行器领域模型确定当前水面自主航行器位置坐标;
[0009]构建针对多水面自主航行器会遇局面下的航行决策判定方式;所述航行决策判定方式用于判断水面自主航行器当前时刻所处的会遇局面;
[0010]通过历史数据训练RG

ABPPO网络模型;所述历史数据包括雷达探测矢量线、历史水面自主航行器的位置坐标、历史目标位置坐标以及历史水面自主航行器操纵的连续舵角;所述RG

ABPPO网络模型中设置有所述航行决策判定方式和奖励机制;
[0011]将所述当前水面自主航行器的位置坐标、目标位置坐标以及所述雷达探测矢量线输入至训练好的RG

ABPPO网络模型中,得到当前水面自主航行器操纵的连续舵角。
[0012]可选地,所述水面自主航行器运动模型的表达式如下:
[0013][0014][0015]其中,表示水面自主航行器位置坐标与航向角组成的向量,R(ψ)表示水面自主航行器的旋转矩阵,ψ表示水面自主航行器首向角,M表示系统惯性矩阵,表示水面自主航行器横移速度,v表示水面自主航行器运动速度矢量,C(v)表示向心矩阵和流体动力学矩阵
之和,D(v)表示非线性阻尼矩阵,g(v)表示未建模的动力学模型,τ表示推进前进力,τ
w
表示环境干扰外力的总。
[0016]可选地,所述水面自主航行器领域模型的表示式如下:
[0017][0018]其中,d1、d3、d5、d6均表示水面自主航行器六边形领域的内径,d2和d4表示水面自主航行器六边形领域的边长,D
CPA
表示最近会遇距离,T
CPA
表示最近会遇时间,U表示水面自主航行器航行过程中的位置误差值,V表示水面自主航行器的速度,L和B分别表示水面自主航行器的长和航行器,D
b
表示安全距离。
[0019]可选地,所述航行决策判定方式如下:
[0020]在两航行器会遇情况下,存在三种情况:
[0021]当本航行器与目标航行器之间的距离小于水面自主航行器领域半径,且目标航行器位于本航行器(112.5
°
,247.5
°
)和(247.5
°
,355
°
)范围内时,本航行器为直航航行器;
[0022]当目标航行器与本航行器之间的距离小于目标航行器领域半径,且目标航行器位于本航行器(355
°
,112.5
°
)范围内时,目标航行器采取符合COLREGs的避障动作;
[0023]当两航行器同时面临紧迫局面时,本航行器与目标航行器均为让路航行器;所述紧迫局面为目标航行器进入本航行器的危险区域;
[0024]在多航行器会遇情况下,当本航行器与目标航行器之间的距离小于水面自主航行器领域半径时,所有航行器均为让路航行器。
[0025]可选地,所述奖励机制包括制导奖励、偏航角修正奖励、碰撞奖励、安全奖励、COLREGs奖励、危险奖励以及转舵奖励。
[0026]可选地,所述制导奖励R_d的计算公式如下:
[0027][0028]其中,λ
d
表示制导奖励权重,x0、y0表示当前水面自主航行器的位置坐标,x
g
、y
g
表示目标位置坐标;
[0029]所述偏航角修正奖励R_yaw的计算公式如下:
[0030]R_yaw=

trλ
y
exp(εyaw)2[0031]其中,λ
y
表示偏航角修正奖励权重,yaw表示偏航角度,tr表示误差系数,e表示偏航角调节因子;
[0032]所述碰撞奖励R_b的计算公式如下:
[0033][0034]所述安全奖励R_s的计算公式如下:
[0035][0036]其中,R
T
表示本航行器与目标航行器之间的距离,R_radar表示激光雷达探测距离,S1表示安全距离;
[0037]所述COLREGs奖励R_c的计算公式如下:
[0038][0039]其中,R
A
表示水面自主航行器领域半径;
[0040]所述危险奖励R_a的计算公式如下:
[0041][0042]其中,R
d
表示设定危险区域的半径;
[0043]所述危险奖励R_r的计算公式如下:
[0044][0045]其中,ψ
m
表示实际操舵角度,δ1为避障奖励系数,δ2为航行奖励系数。
[0046]本专利技术还提供了一种面向多水面自主航行器会遇局面的航行决策系统,包括:
[0047]模型建立模块,用于建立水面自主航行器运动模型和水面自主航行器领域模型;
[0048]位置确定模块,用于根据所述水面自主航行器运动模型和所述水面自主航行器领域模型确定当前水面自主航行器位置坐标;
[0049]航行决策判定方式构建模块,用于构建针对多水面自主航行器会遇局面下的航行决策判定方式;所述航行决策判定方式用于判断水面自主航行器当前时刻所处的会遇局面;
[0050]模型训练模块,用于通过历史数据训练RG

ABPPO网络模型;所述历史数据包括雷达探测矢量线、历史水面自主航行器的位置坐标、历史目标位置坐标以及历史水面自主航行器操纵的连续舵角;所述RG

ABPPO网络模型中设置有所述航行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向多水面自主航行器会遇局面的航行决策方法,其特征在于,包括:建立水面自主航行器运动模型和水面自主航行器领域模型;根据所述水面自主航行器运动模型和所述水面自主航行器领域模型确定当前水面自主航行器位置坐标;构建针对多水面自主航行器会遇局面下的航行决策判定方式;所述航行决策判定方式用于判断水面自主航行器当前时刻所处的会遇局面;通过历史数据训练RG

ABPPO网络模型;所述历史数据包括雷达探测矢量线、历史水面自主航行器的位置坐标、历史目标位置坐标以及历史水面自主航行器操纵的连续舵角;所述RG

ABPPO网络模型中设置有所述航行决策判定方式和奖励机制;将所述当前水面自主航行器的位置坐标、目标位置坐标以及所述雷达探测矢量线输入至训练好的RG

ABPPO网络模型中,得到当前水面自主航行器操纵的连续舵角。2.根据权利要求1所述的面向多水面自主航行器会遇局面的航行决策方法,其特征在于,所述水面自主航行器运动模型的表达式如下:于,所述水面自主航行器运动模型的表达式如下:其中,表示水面自主航行器位置坐标与航向角组成的向量,R(ψ)表示水面自主航行器的旋转矩阵,ψ表示水面自主航行器首向角,M表示系统惯性矩阵,表示水面自主航行器横移速度,v表示水面自主航行器运动速度矢量,C(v)表示向心矩阵和流体动力学矩阵之和,D(v)表示非线性阻尼矩阵,g(v)表示未建模的动力学模型,τ表示推进前进力,表示环境干扰外力的总和。3.根据权利要求1所述的面向多水面自主航行器会遇局面的航行决策方法,其特征在于,所述水面自主航行器领域模型的表示式如下:其中,d1、d3、d5、d6均表示水面自主航行器六边形领域的内径,d2和d4表示水面自主航行器六边形领域的边长,D
CPA
表示最近会遇距离,T
CPA
表示最近会遇时间,U表示水面自主航行器航行过程中的位置误差值,V表示水面自主航行器的速度,L和B分别表示水面自主航行器的长和航行器,D
b
表示安全距离。4.根据权利要求1所述的面向多水面自主航行器会遇局面的航行决策方法,其特征在于,所述航行决策判定方式如下:在两航行器会遇情况下,存在三种情况:当本航行器与目标航行器之间的距离小于水面自主航行器领域半径,且目标航行器位于本航行器(112.5
°
,247.5
°
)和(247.5
°
,355
°
)范围内时,本航行器为直航航行器;当目标航行器与本航行器之间的距离小于目标航行器领域半径,且目标航行器位于本
航行器(355
°
,112.5
°
)范围内时,目标航行器采取符合COLREGs的避障动作;当两航行器同时面临紧迫局面时,本航行器与目标航行器均为让路航行器;所述紧迫局面为目标航行器进入本航行器的危险区域;在多航行器会遇情况下,当本航行器与目标航行器之间的距离小于水面自主航行器领域半径时,所有航行器均为让路航行器。5.根据权利要求1所述的面向多水面自主航行器会遇局面的航行决策方法,其特征在于,所述奖励机制包括制导奖励、偏航角修正奖励、碰撞奖励、安全奖励、COLREGs奖励、危险奖励以及转舵奖励。6.根据权利要求5所述的面向多水面自主航行器会遇局面的航行决策方法,其特征在于,所述制导奖励R_d的计算公式如...

【专利技术属性】
技术研发人员:关巍崔哲闻罗文哲张显库苏作靖
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1