System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于POS-DQN的多无人水面船只海上搜救路径规划方法技术_技高网

一种基于POS-DQN的多无人水面船只海上搜救路径规划方法技术

技术编号:43289871 阅读:23 留言:0更新日期:2024-11-12 16:10
本发明专利技术公开了一种基于POS‑DQN的多无人艇海上搜救路径规划方法,涉及路径规划技术领域。针对多无人艇合理高效的完成海上搜救任务问题,基于改进的任务分配算法和POS‑DQN深度强化学习算法,提供了一种任务分配合理能优先搜寻高概率区域的海上搜救路径规划方法。本发明专利技术首先使用改进的任务分配算法整体划分搜寻区域,让每个无人艇的任务区域具有优先级且无重复的划分。其次本发明专利技术考虑了搜寻环境的POS,提出了一种基于深度强化学习的POS‑DQN算法。该算法能适应搜救的复杂变化环境,利用概率权重奖励函数训练多无人艇得到最优的搜寻路径。最后在考虑了避障避碰的全面覆盖的基础上,搜寻路径能优先搜寻高概率区域,提高了搜救的效率。

【技术实现步骤摘要】

本专利技术涉及路径规划,特别是涉及一种基于pos-dqn的多无人艇海上搜救路径规划方法。


技术介绍

1、国际海洋货物运输作为全球物流的核心组成部分,对世界贸易往来的影响十分巨大。由于海洋环境复杂多变,在海运过程中因自然因素和人为因素造成的海上事故时有发生。高效的海上搜救(sar)对于响应海上紧急情况至关重要。在传统的搜救中,采用固定的搜寻路径规划效率低,且不能优先搜寻高概率区域,具有极大的局限性。针对优先级划分任务分配方法,优先搜寻高概率区域,但是生成的任务区域存在重复情况且无法覆盖整个搜寻区域。针对区域整体划分任务分配方法,任务区域无重复并且全面覆盖,但是忽略了任务的优先级。


技术实现思路

1、针对以上问题,本专利技术的目的是:针对搜救情况中任务区域存在忽略了任务的优先级,重复且无法覆盖整个搜寻区域,路径规划不合理,搜救效率低的问题,提供一种基于pos(probability of success,在搜寻区域内成功发现搜救目标的概率)-dqn(deep q-network)的usvs海上搜救路径规划方法。本专利技术以多无人艇(usv)的搜救为研究对象,针对任务分配与路径规划分别提出改进的任务分配算法与基于pos-dqn的深度强化学习算法,以实现在避障避碰的同时,让每个usv分配的任务区域满足任务的优先级,并且被合理无重复的划分,在搜寻区域能优先搜寻高概率区域,安全又高效的完成搜救任务。

2、为此,本专利技术采用以下技术方案:

3、本专利技术公开了一种基于pos-dqn的多无人艇海上搜救路径规划方法,包括:

4、计算搜寻区域的poc,得到poc分布图;

5、根据无人艇到达搜寻区域的搜寻初始点对搜寻区域进行整体剖分,得到每艘无人艇的搜寻区域,让每艘无人艇的任务区域具有优先级且无重复的划分;

6、将poc分布图与搜寻区域的栅格图结合生成海上搜救环境模型;

7、根据poc分布图,计算pos,pos是在搜寻区域内成功发现搜救目标的概率;

8、利用基于pos-dqn的强化学习方法学习训练无人艇,在海上搜救环境模型获得每个无人艇的最优搜救路径,实现避开障碍物优先搜寻高概率区域。

9、进一步地,计算搜寻区域的poc,得到poc分布图,包括:

10、将搜寻区域细分为相同大小的正方形栅格,计算每个栅格单元的poc,得到搜寻区域的poc分布图;

11、其中,poc的计算公式为:

12、

13、其中mi为栅格i中的粒子数,m为总体分布区域中包含的粒子数。

14、进一步地,确定无人艇到达搜寻区域的搜寻初始点,包括:

15、根据第a艘无人艇距搜寻区域的初始距离与最大航速计算全速到达搜寻区域的时间

16、已知搜寻区域总面积为s,第a艘无人艇在搜寻区域内覆盖搜寻时间为所以第a艘无人艇搜寻任务的总搜寻时间为:

17、最佳的搜救多无人艇协同工作应当最小化搜救时间:

18、根据得到搜救单元的面积约束集合{s1,s2,…,sa…sn};

19、其中da为第a艘无人艇距搜寻区域的初始距离;n为无人艇总数;a为第a个usv;为第a艘无人艇的最大航速;t为整个任务执行所用时间,即多无人艇参与搜救任务执行时间;为第a艘无人艇全速到达搜寻区域的时间;为第a艘无人艇在搜寻区域内覆盖搜寻时间;ta为第a艘无人艇搜寻任务的总搜寻时间;ba为第a艘无人艇的搜寻能力;sa为第a艘无人艇分配的搜寻面积;sn为第n艘无人艇分配的搜寻面积;

20、连接无人艇的初始位置点与搜寻区域中poc最高的栅格中心点得到无人艇抵达搜救区域的理想航线;

21、若无人艇在搜寻区域外,航线与搜寻区域边界的交点为搜寻初始点;若无人艇在搜寻区域内,航线的外延线与搜寻区域边界的交点为搜寻初始点。

22、进一步地,对搜寻区域进行整体剖分,得到每艘无人艇的搜寻区域,包括:

23、将搜寻初始点按照逆时针顺序进行排序,得到第一点集n={n1,n2,n3,…,nn};

24、将搜寻初始点与搜寻区域顶点按照逆时针顺序进行排序,得到第二点集w={w1,w2,w3,…,wm};

25、定义l为扫描线,表示两个端点都在搜寻区域边上的直线段,对扫描线l=(ls,le)进行初始化,ls为扫描线的初始点,le为扫描线的终点,n1=wk,k=0,1,2…m,l←(w1,wk),m为搜寻区域的顶点数与搜寻初始点总和数,wm为点集中第m个点,k为点集中第k个;得到多边形,计算其面积s;

26、若s<sa,l←(w1,wk+1),重新计算面积s;若s>sa,沿着搜寻区域边界逆时针移动扫描线的起点,直到s=sa;

27、在区域线上保持s=sa的情况下移动ls,le的位置,直到与区域线水平或者垂直,即得到第a艘无人艇的分配区域;

28、重复以上操作得到每艘无人艇的搜寻区域。

29、进一步地,基于pos-dqn的深度强化学习算法中奖励函数为概率权重奖励函数。

30、进一步地,概率权重奖励函数rt的公式为:

31、rt=rm×ro×rweight;

32、其中,rm为障碍物奖励:

33、

34、ro为访问次数奖励:

35、

36、rweight为权重奖励:

37、rweight=w×rpoc;rpoc为栅格单元颜色的poc奖励:rpoc=100×poc;w为权重,根据栅格单元颜色的poc大小与是否通过障碍物设计,

38、进一步地,根据poc分布图,计算pos,包括:

39、pos=poc×pod;

40、其中,pod是指在给定的搜寻区域内,搜救目标能被发现的概率,计算公式为:

41、pod=1-e-c;

42、其中,c覆盖率;其中,w为扫海宽度,r为航线间距。

43、本专利技术的优点和积极效果:本专利技术针对usvs合理高效的完成海上搜救任务问题,基于改进的任务分配算法和pos-dqn深度强化学习算法,提供了一种任务分配合理能优先搜寻高概率区域的海上搜救路径规划方法。本专利技术首先使用改进的任务分配算法整体划分搜寻区域,让每个usv的任务区域具有优先级且无重复的划分。其次本专利技术考虑了搜寻环境的pos,提出了一种基于深度强化学习的pos-dqn算法。该算法能适应搜救的复杂变化环境,利用概率权重奖励函数训练usvs agents得到最优的搜寻路径。最后在考虑了避障避碰的全面覆盖的基础上,搜寻路径能优先搜寻高概率区域,提高了搜救的效率。

本文档来自技高网...

【技术保护点】

1.一种基于POS-DQN的多无人艇海上搜救路径规划方法,其特征在于,包括:

2.根据权利要求1所述的一种基于POS-DQN的多无人艇海上搜救路径规划方法,其特征在于,计算搜寻区域的POC,得到POC分布图,包括:

3.根据权利要求2所述的一种基于POS-DQN的多无人艇海上搜救路径规划方法,其特征在于,确定无人艇到达搜寻区域的搜寻初始点,包括:

4.根据权利要求3所述的一种基于POS-DQN的多无人艇海上搜救路径规划方法,其特征在于,对搜寻区域进行整体剖分,得到每艘无人艇的搜寻区域,包括:

5.根据权利要求1所述的一种基于POS-DQN的多无人艇海上搜救路径规划方法,其特征在于,基于DQN的深度强化学习算法中奖励函数为概率权重奖励函数。

6.根据权利要求5所述的一种基于POS-DQN的多无人艇海上搜救路径规划方法,其特征在于,概率权重奖励函数rt的公式为:

7.根据权利要求1所述的一种基于POS-DQN的多无人艇海上搜救路径规划方法,其特征在于,根据POC分布图,计算POS,包括:

【技术特征摘要】

1.一种基于pos-dqn的多无人艇海上搜救路径规划方法,其特征在于,包括:

2.根据权利要求1所述的一种基于pos-dqn的多无人艇海上搜救路径规划方法,其特征在于,计算搜寻区域的poc,得到poc分布图,包括:

3.根据权利要求2所述的一种基于pos-dqn的多无人艇海上搜救路径规划方法,其特征在于,确定无人艇到达搜寻区域的搜寻初始点,包括:

4.根据权利要求3所述的一种基于pos-dqn的多无人艇海上搜救路径规划方法,其特征在于,对搜寻区...

【专利技术属性】
技术研发人员:单麒赫刘璐刘浩然赵浩然林冠廷滕菲
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1