【技术实现步骤摘要】
基于改进的LSTM网络轨迹预测的无人船集群围捕方法
[0001]本专利技术涉及水域环境中的目标围捕以及路径规划
,更特别地说,是指一种基于改进的LSTM网络轨迹预测的无人船集群围捕方法。
技术介绍
[0002]随着科技的发展与进步,人们对海洋的开发越来越广,对海洋的认知也越来越深入。现如今,大部分科研工作者会选择利用无人船进行水域探索任务,单一的无人船在执行任务的过程中存在自身能源有限、任务负载容量低和探索效率低等缺点。因此,寻找一种能够使无人船集群在短时间内对移动的目标的路径轨迹进行预测并围捕的方法,可以提高无人船集群对目标进行围捕时的工作效率。
[0003]当前已经有多种传统方法和智能方法来解决多船围捕问题,比如深度强化学习法,逼近法和伏击法等。
[0004]LSTM(convolutional long short
‑
term memory network,长短期记忆网络)在门控RNN的基础上添加了长期记忆单元,通过遗忘门、输入门和输出门控制时序信息的流动,通过反向传播更新网络的权重,学习长时依赖关系。使用tanh激活函数和Relu激活函数的RNN神经网络的学习步长过短且不稳定,而LSTM神经网络可以稳定学习多步时序关系。LSTM循环网络细胞框图参考2017.07,人民邮电出版社,作者:(美)伊恩
·
古德费洛著的《深度学习》第248-250页的内容。
[0005]狮群算法是一种通过模拟狮群狩猎对目标进行围捕的算法,狮群有多种捕猎方式,通常情况下狮
【技术保护点】
【技术特征摘要】
1.一种基于改进的LSTM网络轨迹预测的无人船集群围捕方法,其特征在于,构建改进的LSTM网络拓扑结构包括有下列步骤:构建步骤A,记录历史路线;发现被围捕船ship
围捕
的时间,记为t0;开始对被围捕船ship
围捕
进行围捕的时间,记为t
s
;所述ship
围捕
从t0到t
s
形成的路径,记为历史路线在历史路线中存在有γ个历史-路径节点,记为历史-路径节点集且且为历史路线上的第1个历史-路径节点;为历史路线上的最后一个历史-路径节点;构建步骤B,获取预测路线;对被围捕船ship
围捕
完成围捕时间,记为t
S
;所述ship
围捕
从t
s
到t
S
形成的路径,记为预测路线采用一元非线性回归法将历史-路径节点集进行处理,得到预测-路径节点集进行处理,得到预测-路径节点集为预测路线上的最后一个预测-路径节点;构建步骤C,修正预测路线;将和
作为LSTM网络的输入,并引入障碍物位置关系对进行修正,得到修正后的预测路线D
o
为障碍物位置关系权重;η为避障学习因子;g为障碍物区域里的边界点总数;t为障碍物区域里的任意一个边界点;x
o,t
为边界点o
t
的边界经度;y
o,t
为边界点o
t
的边界纬度;x表示路径节点的X轴坐标值;y表示路径节点的Y轴坐标值;ρ
O
为障碍物的影响距离。2.根据权利要求1所述的基于改进的LSTM网络轨迹预测的无人船集群围捕方法,其特征在于:利用改进后的LSTM网络拓扑结构进行的无人船集群围捕方法,具体步骤如下:步骤一,利用改进的非线性回归法对被围捕船的轨迹信息进行预处理;步骤101,路径信息获取;对ship
围捕
进行围捕时的路线由n条短路径组成,被围捕-短路径记为下角标i表示被围捕-短路径的标识号,下角标n表示被围捕-短路径的总数;任意一被围捕-短路经上会有c个路径节点,记为径节点,记为表示围捕ship
围捕
时的第1条短路径;表示围捕ship
围捕
时的第2条短路径;表示围捕ship
围捕
时的第i条短路径;表示围捕ship
围捕
时的最后一条短路径;表示短路径中的第1个路径节点;表示短路径中的第2个路径节点;表示短路径中的最后一个路径节点;
步骤102,修正非线性回归的通用模型;为了模拟目标的避障运动,采用非线性回归方法拟合出目标避障波浪线;因此,对非线性回归的通用模型进行了改进,改进后的非线性回归模型表达式如下:x表示路径节点的X轴坐标值;y表示路径节点的Y轴坐标值;a表示非线性回归系数;a
s.c
表示非线性回归中第s行第c列的系数;步骤103,目标避障运动模型;将改进后的非线性回归模型化简为一元一次方程,其表达式如下:采用最小二乘法计算系数,设系数序列为A,目标避障运动模型表达式如下:其中,Y
s
的表达式为:其中,的表达式为:上角标T为X
s
的转置;
步骤二,将水域环境中的障碍物与被围捕船轨迹之间的位置关系函数添加到改进的LSTM神经网络中;步骤201,改进后的LSTM神经网络模型;将障碍物与目标的位置关系添加到了LSTM网络中,其表达式为:f
t
为改进后的LSTM网络中的遗忘门;σ表示sigmoid函数;W
f
是遗忘门权重矩阵;s
t
为隐层序列;s
t
‑1为隐层序列s
t
的前一个隐层序列;为输入的被围捕的目标船的路径信息;D
o
为障碍物位置关系权重;l
t
为障碍物位置关系序列;l
t
‑1为障碍物位置关系序列l
t
的前一个障碍物位置关系序列;b
f
是遗忘门偏执系数;h
t
为改进后的LSTM网络的输出;W
i
是输入门权重矩阵;b
i
是输入门偏执系数;c
t
为记忆细胞序列;c
t
‑1为记忆细胞序列c
t
的前一个记忆细胞序列;i
t
为改进后的LSTM网络中的输入门;为经过tanh函数处理后的记忆细胞;W
c
是记忆细胞权重矩阵;b
c
是记忆细胞偏执系数;o
t
为改进后的LSTM网络中的输出门;W
o
是输出门权重矩阵;b
o
是输出门偏执系数;tanh的作用是将内容归一化到-1到1;Convolution表示卷积函数;步骤202,修正障碍物位置;将障碍物区域记为O,在所述O区域里存在有g个边界点,记为O=[o1,
…
,o
t
,
…
,o
g
],在
障碍物坐标系XOY下,任意一个边界点o
t
的边界位置为o
t
(x
o,t
,y
o,t
);设ρ
O
为障碍物的影响距离,当路径节点与障碍物的距离大于ρ
O
时,D
O
的取值为0;当路径节点与障碍物的距离小于ρ
O
时,D
O
的表达式如下:η为避障学习因子,其值越大,改进后LSTM神经网络就越重视对目标避障动作特征的学习;x
o,t
为边界点o
t
的边界经度;y
o,t
为边界点o
t
的边界纬度;x表示路径节点的X轴坐标值;y表示路径节点的Y轴坐标值;对避障学习因子η进行修正,其表达式如下:ξ为路径学习因子;n为短路径总数;c为任意一条短路径;g为障碍物区域里的边界点总数;t为障碍物区域里的任意一个边界点;x
c
表示短路经上路径节点的X轴坐标值;y
c
表示短路经上路径节点的Y轴坐标值;步骤三,对障碍物进行膨胀处理;若目标为船,则对复杂水域环境中的障碍物进行COLREGs约束处理;障碍物坐标系记为XOY;步骤301,定义障碍物尺寸;由于被围捕船会按照COLREGs进行避障;当障碍物位于Head
‑
on,Overtaking和R
‑
Crossing区域时,目标船舶会遵守右交叉避碰原则;当目标为船时,对环境中的障碍物进行偏心建模;在障碍物坐标系XOY下,以障碍物的中心点为焦点C(c,0)建立椭圆方程,椭圆方程的表达式如下:c2=a2‑
b2,a>c>0且a>b>0;a为椭圆在障碍物坐标系X轴上的增益;b为椭圆在障碍物坐标系Y轴上的增益;步骤302,获取障碍物中心点位置;设障碍物的边界点的坐标为o
t
(x
o,t
,y
o,t
),t=1,
…
,g;则障碍物中心点坐标,的表达式
为:x
oc
为障碍物中心点经度;y
oc
为碍物物中心点纬度;步骤303,修正障碍物边界;求椭圆的X轴增益a的表达式如下:求椭圆的Y轴增益b的表达式如下:max(x
o.t
)表示障碍物边界点中X轴坐标值最大的边界点;min(x
o.t
)表示障碍物边界点中X轴坐标值最小的边界点;max(y
o.t
)表示障碍物边界点中Y轴坐标值最大的边界点;min(y
o.t
)表示障碍物边界点中Y轴坐标值最小的边界点;步骤四,根据改进后LSTM网络的轨迹预测结果,无人船集群对被围捕船进行伏击;模仿狮群的围捕策略,利用虚拟结构法在目标附近生成虚拟结构点,作为初始的伏击位置;步骤401,设置无人船位置;设目标的速度为v
target
,目标的航向角为r
target
,目标的预测位置为P
target
,其坐标为(x
target
,y
target
);第q艘无人船的速度为v
ship.q
,第q艘无人船的航向角为r
ship.q
,第q艘无人船的位置为步骤402,生成无人船的初始虚拟结构点;设共有Q艘无人船,分别对应Q个虚拟结构点;生成第q艘船的初始虚拟结构点P
q
,q=1,
…
,Q,其坐标为(x
virtual.q
,y
virtual.q
),具体公式如下:),具体公式如下:ψ为虚拟结构点位置参数,其值会影响虚拟结构点生成的位置;β为角度参数,其值会影响虚拟结构点生成的角度;步骤403,生成U型阵;通过步骤402生成完所有无人船的初始虚拟结构点后,调整初始虚拟结构点的位置,在目标前进的方位上生成U型阵的具体步骤如下:...
【专利技术属性】
技术研发人员:于家斌,陈志豪,赵峙尧,许继平,王立,孙茜,陈阳,陆阳,
申请(专利权)人:北京工商大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。