【技术实现步骤摘要】
针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络
[0001]本专利技术属于机器人、无人机、巡航导弹、无人驾驶等人工智能领域中的路径规划方向,具体涉及一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络模型。
技术介绍
[0002]路径规划技术无论是在高新
:机器人的自主无碰行动,巡航导弹躲避雷达搜索等;还是在日常生活领域:GPS导航,城市道路规划等都有广泛的应用。路径规划技术还可以应用于决策管理领域中的资源配置问题,通信
中的路由问题等。总的来说,凡是可拓扑为点线网络的规划问题基本上都可以采用路径规划方法解决。路径规划的核心是算法的设计,算法的优劣直接决定了路线的优劣,不同的算法特点不同适用范围和领域也就不同。
[0003]目前,路径规划的方法有以下几种:
[0004]1)Dijkstra算法
[0005]Dijkstra算法是一种典型的最短路径算法,它是以起始点为中心向外层层扩展直到扩展到终点为止,即通过所有节点的正向遍历比较得到最短路径。因为它是遍历完所有节点才得到最短路径,所以得到的最短路径成功率很高,鲁棒性也好;但是遍历节点多,效率低是其运用于大型复杂路径拓扑网络时的致命缺点,此外,Dijkstra算法也不能处理有负边的问题。
[0006]2)A
‑
star启发式搜索算法,简称A*算法
[0007]A*算法是一种启发式搜索算法,通过设定合适的启发函数,全面评估各扩展搜索节点的代价值,通过比较各扩展节点代价值的大小, ...
【技术保护点】
【技术特征摘要】
1.一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络,其特征在于,包括以下步骤:步骤1,获取包含障碍物、起点和终点的环境图,并将环境图分为训练集和测试集,其中,地图为黑白图片,黑色为障碍物,白色为可运动区域,采用两个点表示起点和终点;步骤2,将训练集输入改进的快速随机搜索树算法,利用改进的快速随机搜索树算法生成真实地图路径;步骤3,构建串联通道空间反馈注意力模型,该模型包括通道注意力模块、空间注意力模块和反馈结构;步骤4,基于构建的串联通道空间反馈注意力模型,搭建具有通道空间注意力机制的反馈生成对抗网络;步骤5:将训练集的带有起始点和终点的原始地图、真实地图路径作为反馈生成对抗网络的输入进行训练,训练结束后保存权重;最后将测试集的带有起始点和终点的原始地图作为网络的输入,生成最优路径,并保存最优路径结果。2.根据权利要求1所述的一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络,其特征在于,所述的步骤2包括以下步骤:首先,将起始点作为第一个节点,在每一次循环中产生一个随机点x
rand
,随机点的生成是任意的,即可以是环境图上的任意一点;将生成的点与上一次生成的点进行连接,经过不断的循环,会生成一个节点图,并定义这个节点图为“树”;从所构建的树中寻找距离x
rand
最近的节点x
near
,连接x
near
和x
rand
,从x
near
到x
rand
这个连接线的方向是树生长的方向;其次,设置一个步长Stepsize,作为树一次生长的步长,会在生长的末端产生一个新的节点x
new
,判断x
new
和x
near
之间的连线是否穿过障碍物:如穿过则舍弃x
new
重新选择节点,如不穿过则保留x
new
;最后,以x
new
为中心,在定义的半径范围内找寻与x
new
相邻节点x
neig hbor
,计算起始点到x
neig hbor
的路径距离与x
neig hbor
到x
new
的路径距离之和,选取路径距离最小的节点x
neig hbor
作为新的父节点代替原有的采样点x
near
,并且为x
new
的相邻节点重新布线,使得所有节点到起始点的距离总和最小;进一步的,所述的定义的半径范围可以根据需要自行设定;经过不断的重复上述步骤,直到x
new
到达终点附近,结束循环,得到真实地图路径;所述的终点附近可以理解为以终点为圆心,根据需要自行设定半径,当x
new
出现在该圆内时,即可认为到达终点附近。3.根据权利要求1所述的一种针对智能体路径规划的具有通道空间注意力机制的反馈生成对抗网络,其特征在于,所述的步骤3包括以下步骤:(3.1)通道注意力模块,通过通道注意力机制得到特征图F
C
,具体为:首先,将带有起点和终点的环境图转换为特征图F(C x H x W),将输入的特征图F分别经过H x W的切片的全局最大池化和全局平均池化,得到两个C x 1x 1的特征图,记为和再将它们分别送入一个共享网络,来对应生成特征和且尺寸大小不变;其次,将两种特征逐元素求和,再经过sigmoid激活操作,生成通道注意力图记为M
C
;最后,对M
C
进行维度扩充使之变为C x H x W的特征图,记为M
′
C
,将M
′
C
与特征图F相乘得到最后的特征图F
C
;
所述的共享网络为多层感知器MLP;所述的通道注意力机制的计算过程如下:所述的通道注意力机制的计算过程如下:所述的通道注意力机制的计算过程如下:其中,C表示通道数,H表示图片的高度,W表示图片的宽度,σ为激活函数;(3.2)空间注意力模块,通过空间注意力机制得到特征图F
S
,具体为:首先,将带有起点和终点的环境图转换为特征图F(C x H x W),将输入的特征图F基于维度C应用全局平均池化和全局最大池化,得到两个1x H x W的特征图,记为和再将两个特征图基于通道做拼接操作;其次,经过一个7x 7卷积操作,降维为1个通道,即1x H x W,再经过激活函数生成空间注意力图M
S
;最后,对M
S
进行维度扩充使之变为C x H x W的特...
【专利技术属性】
技术研发人员:孙涛,杜子亮,孙希明,李建胜,王帅,张一凡,
申请(专利权)人:中国航空系统工程研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。