【技术实现步骤摘要】
本专利技术涉及多智能体强化学习,特别是涉及一种基于动态协作的多无人系统场景感知决策方法及系统。
技术介绍
1、无人系统一般利用自身搭载的各类传感器来进行实时的场景感知与理解,并在完成对环境状态的分析和理解后,根据自身的行为策略选择相应的执行动作。然而,在大多数现实应用中存在着无人系统感知不完备以及场景动态多变的问题,使得无人系统对任务场景的态势认知不完备或不准确,这也给多无人系统的协同决策带来巨大的挑战。
2、在现有技术中,一般采用构建全局静态协作图的方法来确定各无人系统不同时刻的执行动作,但全局静态协作图通常只是基于无人系统的各类传感器感知的外界场景信息来确定,属于静态处理的过程,难以应对外界动态的协作场景,且并没有考虑无人系统之间协作关系的重要程度,这也使得各无人系统做出的执行动作并不协调,各无人系统之间的配合并不默契。
技术实现思路
1、本专利技术实施例的目的是提供一种基于动态协作的多无人系统场景感知决策方法及系统,充分考虑多无人系统之间的动态协作关系,提高各无人系统执行
...【技术保护点】
1.一种基于动态协作的多无人系统场景感知决策方法,其特征在于,包括:
2.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法,其特征在于,训练好的第一网络模块包括:第一全连接神经网络、门控循环网络和第二全连接神经网络;
3.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法,其特征在于,训练好的第二网络模块包括:预编码矩阵单元和多头注意力网络;
4.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法,其特征在于,训练好的第三网络模块包括:图卷积网络、第三全连接神经网络和执行动作筛选单元;
5
...【技术特征摘要】
1.一种基于动态协作的多无人系统场景感知决策方法,其特征在于,包括:
2.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法,其特征在于,训练好的第一网络模块包括:第一全连接神经网络、门控循环网络和第二全连接神经网络;
3.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法,其特征在于,训练好的第二网络模块包括:预编码矩阵单元和多头注意力网络;
4.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法,其特征在于,训练好的第三网络模块包括:图卷积网络、第三全连接神经网络和执行动作筛选单元;
5.根据权...
【专利技术属性】
技术研发人员:谢少荣,李洋,骆祥峰,王欣芝,李玉峰,王乾慧,
申请(专利权)人:上海大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。