一种针对最优路径规划的分布式反馈混联注意力网络模型制造技术

技术编号:37353528 阅读:14 留言:0更新日期:2023-04-27 07:04
本发明专利技术属于多智能体系统路径规划技术领域,具体涉及一种针对最优路径规划的分布式反馈混联注意力网络模型。本发明专利技术提供了一种基于分布式结构的带有反馈混联注意力的生成对抗神经网络模型,并获得了更好的路径规划效果。本发明专利技术通过上卷积将聚合后的图像特征恢复到原图像水平,同时将高维图像和低维图像进行融合,从而可以完成对图像的多维度特征提取,最终得到预测路径图像。之后将预测路径图和真实路径图输入到判别器进行迭代学习,使得生成的路径预测图更加贴近真实路径图。所以该模型能够精确地生成路径预测图。够精确地生成路径预测图。够精确地生成路径预测图。

【技术实现步骤摘要】
一种针对最优路径规划的分布式反馈混联注意力网络模型


[0001]本专利技术属于多智能体系统路径规划
,具体涉及一种针对最优路径规划的分布式反馈混联注意力网络模型。

技术介绍

[0002]路径规划技术在自主机器人、无人机群和无人舰队等多智能体系统中占有重要地位,它的优劣直接决定了多智能体任务的成功率和完成度。路径规划问题的目标是为多智能体生成一条从初始状态到目标状态的无碰撞最优路径。传统的路径规划方法主要是基于图网络法和启发式算法,它们经常会出现路径局部最优的问题,并且在高维空间环境下,算法计算量庞大,不仅占用了内存空间,也无法保证生成一条最优路径。解决该问题的有效方法是针对环境图,提出一种随机搜索树算法,从而引导多智能体以安全的路线向目标点运动。在完成物品运输、空中巡航和海上侦察等任务时,多智能体可以精准地避开障碍物并且运动轨迹更加合理,提高了工作效率的同时避免了不必要的资源损耗。
[0003]目前,对多智能体进行路径规划的方法有以下几种:
[0004]1)基于随机搜索树算法的路径规划方法。
[0005]该方法是在环境图中确定一个起始点,以该点为根节点,对地图进行随机采样,将新的采样点和最近的节点相连,若两节点间的连线没有经过障碍物,则认定新的采样点为有效节点,加入到随机树内;若经过障碍物,则认定新的采样点为无效节点,继续下一次采样。直到目标点进入到随机树的一定范围内,停止搜索,连接目标点和最终的采样点,生成一条由起始点到终止点的可行路径。该方法在全局地图上进行随机采样,具有概率完备性,并且搜索效率高,能保证生成一条从起始点到终点的可行路径,但是该路径不一定为最优路径,并且在障碍物之间的空隙较小的情况下,无法产生连续可行路径,所以该算法路径规划效果欠佳。
[0006]2)基于改进的随机搜索树算法的路径规划方法。
[0007]该方法是以环境图中的初始点为根节点,在环境图中进行随机采样,若新采样点和最近节点的连线没有经过障碍物,则添加新的采样点到搜索树内,若经过障碍物,则新的采样点无效,进行下一次采样。每次采样过后重新对随机树布线,使得新的采样点到初始点的连线总距离最短,从而达到整体路径最优的效果。该方法能生成一条由起始点到终点的最优路径,但是该方法的搜索路径为全局地图,采样点过多,每次迭代后需要重新布线,导致最终收敛到最优路径的速度缓慢。
[0008]综合以上论述,本专利技术设计的基于分布式结构的带有反馈混联注意力机制的生成对抗神经网络模型可以高效地完成多智能体的路径规划任务。本专利由中国博士后科学基金(2022TQ0179)和国家重点研发计划(2022YFF0610900)资助。

技术实现思路

[0009]本专利技术针对随机搜索树算法和改进的随机搜索树算法在多智能体路径规划中所
带来的局限性问题,提供了一种基于分布式结构的带有反馈混联注意力的生成对抗神经网络模型,并获得了更好的路径规划效果。由于路径规划的好坏直接决定了多智能体的任务完成度,传统的随机搜索树算法和改进的随机搜索树算法通过对环境图进行全局搜索生成一条由起始点到终点的可行路径,具有概率完备性但欠聚焦性,因此如何在环境图中预测路径区域进行重点采样一直是一个具有挑战性的难题。
[0010]本专利技术的技术方案:
[0011]一种针对最优路径规划的分布式反馈混联注意力网络模型,步骤如下:
[0012]步骤1:生成真实路径图像
[0013](1.1)准备环境图
[0014]环境图是由黑白两种颜色构成的灰度图,如图1所示,静态障碍物由黑色表示,可运动区域由白色表示,图中两点分别代表运动的起始点和终止点。
[0015](1.2)选择改进的随机搜索树算法生成真实路径
[0016]改进的随机搜索树算法的输入为环境图,将图中的起始点作为搜索树的根节点,在环境图上进行随机采样,新的采样点为X
rand
,在搜索树中找寻距离X
rand
最近的点,记为X
near
,连接X
rand
和X
near
,X
near
指向X
rand
的方向为搜索树生长的方向,选取一个步长Step作为随机树生长的距离,若X
near
与X
rand
之间的距离小于Step,则X
rand
即为下一个新的节点X
new
,若X
rand
与X
near
之间的距离大于Step,则从X
near
沿树生长的方向计算一个Step距离,得到新的节点X
new
。之后判断X
near
到X
new
的连线是否穿过障碍物,如果穿过代表该路径无效,放弃节点X
new
;如果没有穿过代表该路径有效,则将X
new
加入到搜索树中。以X
new
为中心,在一定半径范围内找寻与X
new
相邻节点X
nearest
,计算起始点到X
nearest
的路径距离与X
nearest
到X
new
的路径距离之和,选取路径距离最小的节点X
min
作为新的父节点代替原有的采样点X
near
,并且为X
min
的相邻节点重新布线,使得所有节点到起始点的距离总和最小。当终止点进入到搜索树节点的一定范围内,连接终止点和末端节点,所有起点到终点的路径集合为真实路径集。
[0017]步骤2:构建反馈混联注意力机制模型
[0018]反馈混联注意力机制模型网络结构图如图2(a)所示,可以分为混联注意力网络和循环反馈网络。
[0019](2.1)混联注意力网络
[0020]混联注意力网络主体由通道注意力机制、空间注意力机制和位置注意力机制三部分组成,空间注意力和位置注意力机制并联再与通道注意力机制串联,空间注意力模块利用特征的空间关系得到特征间的相关性,位置注意模块将范围更广的上下文信息编码为局部特征,从而增强其表示能力,两者在通道维度上进行拼接达到互补的效果,通道注意力模块聚合所有特征信息,根据通道的重要性分配相应的比例,可以更好地对图像信息进行表达。
[0021](2.1.1)通道注意力机制
[0022]我们首先通过使用自适应平均池化和自适应最大池化操作聚合特征图的空间信息,生成两个不同的空间图像文描述方式:F
avg
和F
max
,分别表示自适应平均池化特征和自适应最大池化特征,将其经过共享网络生成通道映射F
CA
。共享网络由多层感知机(MLP)和激活隐层组成,隐藏激活参数大小为(b*c/r)*1*1,可以减少参数开销,整个网络结构如图2(b)所示,图像分辨率参数变化可以表示为(b,c,h,w)—(b,c本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对最优路径规划的分布式反馈混联注意力网络模型,其特征在于,步骤如下:步骤1:生成真实路径图像(1.1)准备环境图环境图是由黑白两种颜色构成的灰度图,静态障碍物由黑色表示,可运动区域由白色表示,图中两点分别代表运动的起始点和终止点;(1.2)选择改进的随机搜索树算法生成真实路径改进的随机搜索树算法的输入为环境图,将图中的起始点作为搜索树的根节点,在环境图上进行随机采样,新的采样点为X
rand
,在搜索树中找寻距离X
rand
最近的点,记为X
near
,连接X
rand
和X
near
,X
near
指向X
rand
的方向为搜索树生长的方向,选取一个步长Step作为随机树生长的距离,若X
near
与X
rand
之间的距离小于Step,则X
rand
即为下一个新的节点X
new
,若X
rand
与X
near
之间的距离大于Step,则从X
near
沿树生长的方向计算一个Step距离,得到新的节点X
new
;之后判断X
near
到X
new
的连线是否穿过障碍物,如果穿过代表该路径无效,放弃节点X
new
;如果没有穿过代表该路径有效,则将X
new
加入到搜索树中;以X
new
为中心,在一定半径范围内找寻与X
new
相邻节点X
nearest
,计算起始点到X
nearest
的路径距离与X
nearest
到X
new
的路径距离之和,选取路径距离最小的节点X
min
作为新的父节点代替原有的采样点X
near
,并且为X
min
的相邻节点重新布线,使得所有节点到起始点的距离总和最小;当终止点进入到搜索树节点的一定范围内,连接终止点和末端节点,所有起点到终点的路径集合为真实路径集;步骤2:构建反馈混联注意力机制模型(2.1)混联注意力网络混联注意力网络主体由通道注意力机制、空间注意力机制和位置注意力机制三部分组成,空间注意力和位置注意力机制并联再与通道注意力机制串联,空间注意力模块利用特征的空间关系得到特征间的相关性,位置注意模块将范围更广的上下文信息编码为局部特征,从而增强其表示能力;(2.2)循环反馈网络首先将初始特征(x)经过卷积核为1*1的卷积网络(Conv2),另一部分经过卷积核为1*1的卷积网络(Conv3)、卷积核为3*3的卷积网络(Conv4)和卷积核为1*1的卷积网络(Conv5),二者求和为第一次提取特征的结果之后开始进行循环反馈过程,将t=0时刻得到的结果正反馈到输入位置,此时经通过下面Conv3、Conv4和Conv5的卷积网络,所有时刻的循环反馈过程表示如下:的循环反馈过程表示如下:其中F表示卷积运算,下标表示卷积模块名称,上标表示第t次时刻下的卷积,x表示输出特征输入;整个循环反馈过程如图所示,初始特征通过并联的位置注意力机制和空间注意力机制,将结果拼接后输入通道注意力机制,同时初始特征输入循环反馈网络,将最后一次反馈的输出与Conv1之后的结果相加,整个流程如下:
其中F
PSCAF
表示反馈混联注意力模块的输出结果,F
Conv1
表示经过卷积模块Conv1的输出,F
CA
表示经过通道注意力模块的输出,F
PA
表示经过位置注意力模块的输出,F
SA
经过空间注意力模块的输出,经过t次反馈卷积之后的输出;步骤3:生成对抗网络(3.1)分布式结构的生成器网络生成器网络基于U

net的网络架构,该网络分为编码器和解码器两部分;编码器主体由分布式结构的卷积和反馈混联注意力模块构成;生成器的损失定义为生成映射和目标映射的sigmoid交叉熵损失函数,生成器部分损失表达为:CE(g,t)=

[t*ln(M)+(1

g)*ln(1

M)](13)其中g,t代表两组输入,M表示经过sigmoid函数的结果,CE为两组输入的交叉熵损失函数;(3.2)判别器判别器网络包括两组输入,一组为环境图和真实路径图像,判别器网络应将其判别为真,另一对为全局环境图和基于分布式结构的带有反馈混联注意力机制的神经网络预测路径图,判别器网络应将其判别为假;步骤4:对输入的环境图进行路径预测首先根据输入的环境图,通过步骤1的随机搜索树算法获得真实路径图,然后把环境图输入到基于分布式结构的带有反馈混联注意力机制的生成器生成路径预测图,通过不断迭代学习,最终得到针对初始环境图的路径预测图。2.如权利要求1所述的一种针对最优路径规划的分布式反馈混联注意力网络模型,其特征在于,所述的步骤(2.1)混联注意力网络,具体操作如下:(2.1.1)通道注意力机制首先通过使用自适应平均池化和自适应最大池化操作聚合特征图的空间信息,生成两个不同的空间图像文描述方式:F
avg
和F
max
,分别表示自适应平均池化特征和自适应最大池化特征,将其经过共享网络生成通道映射F
CA
;共享网络由多层感知机(MLP)和激活隐层组成,隐藏激活参数大小为(b*c/r)*1*1,图像分辨率参数变化表示为(b,c,h,w)—(b,c,1,1)—(b,c/r,1,1)—(b,c/r,1,1)—(b,c,1,1)—(b,c,1,1);其中b...

【专利技术属性】
技术研发人员:马松张一凡孙涛孙希明林鹏刘波
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1