针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络制造技术

技术编号:37142569 阅读:21 留言:0更新日期:2023-04-06 21:48
一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络,首先,获取包含障碍物、起点和终点的环境图,并将环境图分为训练集和测试集;其次,将训练集输入改进的快速随机搜索树算法,利用改进的快速随机搜索树算法生成真实地图路径;再次,构建串联通道空间反馈注意力模型;最后,搭建具有通道空间注意力机制的反馈生成对抗网络。搭建好网络后将训练集输入网络,训练结束后保存权重,再将测试集输入网络得到最优路径。本发明专利技术充分考虑时效性和准确性,能够快速的寻找路径提高效率,且生成的路径包含了最优路径并大部分集中在最优路径附近,能够提高准确性;注意力机制的加入使得特征之间的相关性增强,明显提高生成路径的质量。成路径的质量。成路径的质量。

【技术实现步骤摘要】
针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络


[0001]本专利技术属于机器人、无人机、巡航导弹、无人驾驶等人工智能领域中的路径规划方向,具体涉及一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络模型。

技术介绍

[0002]路径规划技术无论是在高新
:机器人的自主无碰行动,巡航导弹躲避雷达搜索等;还是在日常生活领域:GPS导航,城市道路规划等都有广泛的应用。路径规划技术还可以应用于决策管理领域中的资源配置问题,通信
中的路由问题等。总的来说,凡是可拓扑为点线网络的规划问题基本上都可以采用路径规划方法解决。路径规划的核心是算法的设计,算法的优劣直接决定了路线的优劣,不同的算法特点不同适用范围和领域也就不同。
[0003]目前,路径规划的方法有以下几种:
[0004]1)Dijkstra算法
[0005]Dijkstra算法是一种典型的最短路径算法,它是以起始点为中心向外层层扩展直到扩展到终点为止,即通过所有节点的正向遍历比较得到最短路径。因为它是遍历完所有节点才得到最短路径,所以得到的最短路径成功率很高,鲁棒性也好;但是遍历节点多,效率低是其运用于大型复杂路径拓扑网络时的致命缺点,此外,Dijkstra算法也不能处理有负边的问题。
[0006]2)A

star启发式搜索算法,简称A*算法
[0007]A*算法是一种启发式搜索算法,通过设定合适的启发函数,全面评估各扩展搜索节点的代价值,通过比较各扩展节点代价值的大小,选择最有希望的点加以扩展,直到找到目标节点为止。该方法的优点是扩展节点少,鲁棒性好,对环境信息反应快;缺点是实时性差,每一个节点计算量大、运算时间长,而且随着节点数的增多,算法搜索效率降低,而且该算法并没有完全遍历所有可行解,所得到的结果不一定是最优解。
[0008]综合以上论述,本专利技术设计的具有通道空间注意力机制的反馈生成对抗网络可以高效准确的完成路径规划。本专利由中国博士后科学基金(2022TQ0179)资助。

技术实现思路

[0009]本专利技术针对Dijkstra算法和A*算法在路径规划中所带来的局限性问题,提出了一种具有通道空间注意力机制的反馈生成对抗网络模型,获得了更好的路径规划效果。由于路径规划对于时效性和准确性的要求较高,因此如何在环境图中利用较少的时间找到最优路径一直是一个具有挑战性的难题。
[0010]为了达到上述目的,本专利技术采用的技术方案为:
[0011]一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络,首
先,获取包含障碍物、起点和终点的环境图,并将环境图分为训练集和测试集;其次,将训练集输入改进的快速随机搜索树算法,利用改进的快速随机搜索树算法生成真实地图路径;再次,构建串联通道空间反馈注意力模型,该模型分为通道注意力模块、空间注意力模块和反馈结构;最后,基于构建的串联通道空间反馈注意力模型,搭建具有通道空间注意力机制的反馈生成对抗网络。搭建好网络后将训练集输入网络,训练结束后保存权重,再将测试集输入进网络,得到路径。具体包括以下步骤:
[0012]步骤1:获取环境图。
[0013]环境图为64x 64x 3像素的图片,包括三部分:地图、起点和终点。其中,地图为黑白图片,黑色为障碍物,白色为可运动区域;用两个点表示起点和终点。将环境图分为训练集和测试集。
[0014]步骤2:将训练集输入改进的快速随机搜索树算法,利用改进的快速随机搜索树算法生成真实地图路径。具体为:
[0015]首先,将起始点作为第一个节点,在每一次循环中产生一个随机点x
rand
,随机点的生成是任意的,即可以是环境图上的任意一点。将生成的点与上一次生成的点进行连接,经过不断的循环,会生成一个节点图,并定义这个节点图为“树”。从所构建的树中寻找距离x
rand
最近的节点x
near
,连接x
near
和x
rand
,从x
near
到x
rand
这个连接线的方向是树生长的方向。
[0016]其次,设置一个步长Stepsize,作为树一次生长的步长,会在生长的末端产生一个新的节点x
new
,判断x
new
和x
near
之间的连线是否穿过障碍物:如穿过则舍弃x
new
重新选择节点,如不穿过则保留x
new

[0017]最后,以x
new
为中心,在定义的半径范围内找寻与x
new
相邻节点x
neighbor
,计算起始点到x
neighbor
的路径距离与x
neighbor
到x
new
的路径距离之和,选取路径距离最小的节点x
neighbor
作为新的父节点代替原有的采样点x
near
,并且为x
new
的相邻节点重新布线,使得所有节点到起始点的距离总和最小。进一步的,所述的定义的半径范围可以根据需要自行设定。
[0018]经过不断的重复上述步骤,直到x
new
到达终点附近,结束循环,得到真实地图路径。所述的终点附近可以理解为以终点为圆心,根据需要自行设定半径,当x
new
出现在该圆内时,即可认为到达终点附近。
[0019]步骤3:构建串联通道空间反馈注意力模块。该模型分为通道注意力模块、空间注意力模块和反馈结构。如图2所示。
[0020](3.1)通道注意力模块,通过通道注意力机制得到特征图F
C
,具体为:
[0021]将带有起点和终点的环境图转换为特征图F(C x H x W)。如图2(a)所示,将输入的特征图F分别经过H x W的切片的全局最大池化(MaxPool)和全局平均池化(AvgPool),得到两个C x 1x 1的特征图,记为和再将它们分别送入一个共享网络来对应生成特征和且尺寸大小不变,然后将两种特征逐元素求和,再经过sigmoid激活操作,生成通道注意力图记为M
C
。然后对M
C
进行维度扩充使之变为C x H x W的特征图,记为M

C
,将M

C
与特征图F相乘得到最后的特征图F
C
。图像的分辨率参数变化表示为(C x H x W)—(C x 1x 1)—(C/rx 1x 1)—(C/r x 1x 1)—(C x 1x 1)—(C x 1x 1)—(C x H x W)—(C x H x W)。
[0022]所述的共享网络为多层感知器(MLP),MLP结构为输入层

隐藏层

输出层,为了减
少参数开销,隐藏激活大小设置为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络,其特征在于,包括以下步骤:步骤1,获取包含障碍物、起点和终点的环境图,并将环境图分为训练集和测试集,其中,地图为黑白图片,黑色为障碍物,白色为可运动区域,采用两个点表示起点和终点;步骤2,将训练集输入改进的快速随机搜索树算法,利用改进的快速随机搜索树算法生成真实地图路径;步骤3,构建串联通道空间反馈注意力模型,该模型包括通道注意力模块、空间注意力模块和反馈结构;步骤4,基于构建的串联通道空间反馈注意力模型,搭建具有通道空间注意力机制的反馈生成对抗网络;步骤5:将训练集的带有起始点和终点的原始地图、真实地图路径作为反馈生成对抗网络的输入进行训练,训练结束后保存权重;最后将测试集的带有起始点和终点的原始地图作为网络的输入,生成最优路径,并保存最优路径结果。2.根据权利要求1所述的一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络,其特征在于,所述的步骤2包括以下步骤:首先,将起始点作为第一个节点,在每一次循环中产生一个随机点x
rand
,随机点的生成是任意的,即可以是环境图上的任意一点;将生成的点与上一次生成的点进行连接,经过不断的循环,会生成一个节点图,并定义这个节点图为“树”;从所构建的树中寻找距离x
rand
最近的节点x
near
,连接x
near
和x
rand
,从x
near
到x
rand
这个连接线的方向是树生长的方向;其次,设置一个步长Stepsize,作为树一次生长的步长,会在生长的末端产生一个新的节点x
new
,判断x
new
和x
near
之间的连线是否穿过障碍物:如穿过则舍弃x
new
重新选择节点,如不穿过则保留x
new
;最后,以x
new
为中心,在定义的半径范围内找寻与x
new
相邻节点x
neig hbor
,计算起始点到x
neig hbor
的路径距离与x
neig hbor
到x
new
的路径距离之和,选取路径距离最小的节点x
neig hbor
作为新的父节点代替原有的采样点x
near
,并且为x
new
的相邻节点重新布线,使得所有节点到起始点的距离总和最小;进一步的,所述的定义的半径范围可以根据需要自行设定;经过不断的重复上述步骤,直到x
new
到达终点附近,结束循环,得到真实地图路径;所述的终点附近可以理解为以终点为圆心,根据需要自行设定半径,当x
new
出现在该圆内时,即可认为到达终点附近。3.根据权利要求1所述的一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络,其特征在于,所述的步骤3包括以下步骤:(3.1)通道注意力模块,通过通道注意力机制得到特征图F
C
,具体为:首先,将带有起点和终点的环境图转换为特征图F(C x H x W),将输入的特征图F分别经过H x W的切片的全局最大池化和全局平均池化,得到两个C x 1x 1的特征图,记为和再将它们分别送入一个共享网络,来对应生成特征和且尺寸大小不变;其次,将两种特征逐元素求和,再经过sigmoid激活操作,生成通道注意力图记为M
C
;最后,对M
C
进行维度扩充使之变为C x H x W的特征图,记为M

C
,将M

C
与特征图F相乘得到最后的特征图F
C

所述的共享网络为多层感知器MLP;所述的通道注意力机制的计算过程如下:所述的通道注意力机制的计算过程如下:所述的通道注意力机制的计算过程如下:其中,C表示通道数,H表示图片的高度,W表示图片的宽度,σ为激活函数;(3.2)空间注意力模块,通过空间注意力机制得到特征图F
S
,具体为:首先,将带有起点和终点的环境图转换为特征图F(C x H x W),将输入的特征图F基于维度C应用全局平均池化和全局最大池化,得到两个1x H x W的特征图,记为和再将两个特征图基于通道做拼接操作;其次,经过一个7x 7卷积操作,降维为1个通道,即1x H x W,再经过激活函数生成空间注意力图M
S
;最后,对M
S
进行维度扩充使之变为C x H x W的特...

【专利技术属性】
技术研发人员:孙涛杜子亮孙希明李建胜王帅张一凡
申请(专利权)人:中国航空系统工程研究所
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1