一种基于动态协作的多无人系统场景感知决策方法及系统技术方案

技术编号：41578237 阅读：21 留言：0更新日期：2024-06-06 23:55

本发明专利技术公开一种基于动态协作的多无人系统场景感知决策方法及系统，涉及多智能体强化学习领域，包括：获取各无人系统当前时刻的传感器信息和上一时刻的执行动作；将所有无人系统当前时刻的传感器信息和上一时刻的执行动作输入多无人系统场景感知决策模型，得到各无人系统当前时刻的执行动作；多无人系统场景感知决策模型包括训练好的第一网络模块、第二网络模块和第三网络模块；训练好的第一网络模块用于确定各无人系统当前时刻的时序轨迹预先编码向量；训练好的第二网络模块用于确定当前时刻的无人系统动态协作关系邻接矩阵；训练好的第三网络模块用于确定各无人系统当前时刻的执行动作。本发明专利技术提高各无人系统执行动作的有效性，促进团队协作。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多智能体强化学习，特别是涉及一种基于动态协作的多无人系统场景感知决策方法及系统。

技术介绍

1、无人系统一般利用自身搭载的各类传感器来进行实时的场景感知与理解，并在完成对环境状态的分析和理解后，根据自身的行为策略选择相应的执行动作。然而，在大多数现实应用中存在着无人系统感知不完备以及场景动态多变的问题，使得无人系统对任务场景的态势认知不完备或不准确，这也给多无人系统的协同决策带来巨大的挑战。

2、在现有技术中，一般采用构建全局静态协作图的方法来确定各无人系统不同时刻的执行动作，但全局静态协作图通常只是基于无人系统的各类传感器感知的外界场景信息来确定，属于静态处理的过程，难以应对外界动态的协作场景，且并没有考虑无人系统之间协作关系的重要程度，这也使得各无人系统做出的执行动作并不协调，各无人系统之间的配合并不默契。

技术实现思路

1、本专利技术实施例的目的是提供一种基于动态协作的多无人系统场景感知决策方法及系统，充分考虑多无人系统之间的动态协作关系，提高各无人系统执行...

【技术保护点】

1.一种基于动态协作的多无人系统场景感知决策方法，其特征在于，包括：

2.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法，其特征在于，训练好的第一网络模块包括：第一全连接神经网络、门控循环网络和第二全连接神经网络；

3.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法，其特征在于，训练好的第二网络模块包括：预编码矩阵单元和多头注意力网络；

4.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法，其特征在于，训练好的第三网络模块包括：图卷积网络、第三全连接神经网络和执行动作筛选单元；

5.根据权利要求1所述...

【技术特征摘要】

1.一种基于动态协作的多无人系统场景感知决策方法，其特征在于，包括：

3.根据权利要求1所述的基于动态协作的多无人系统场景感知决策方法，其特征在于，训练好的第二网络模块包括：预编码矩阵单元和多头注意力网络；

5.根据权...

【专利技术属性】
技术研发人员：谢少荣，李洋，骆祥峰，王欣芝，李玉峰，王乾慧，
申请(专利权)人：上海大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人