基于MADDPG的无人艇集群任务调度与协同对抗方法技术

技术编号：37459732 阅读：17 留言：0更新日期：2023-05-06 09:32

本发明专利技术公开一种基于MADDPG的无人艇集群任务调度与协同对抗方法，涉及无人艇集群博弈对抗技术领域，包括：获取我方艇的我方探测数据和当前动作奖励；基于长短期记忆网络和敌方艇的当前状态集预测敌方艇的下一状态集，然后修正当前动作奖励以得到初次修正奖励值；基于隶属度函数

全部详细技术资料下载

【技术实现步骤摘要】
基于MADDPG的无人艇集群任务调度与协同对抗方法

[0001]本专利技术涉及无人艇集群博弈对抗
，特别是涉及一种基于MADDPG的无人艇集群任务调度与协同对抗方法。

技术介绍

[0002]随着无人艇在军事、民用两方面表现出来的高效性能，无人艇的应用也逐渐从单个个体扩展为群体协同，在复杂海域环境中无人艇集群需要根据分配的任务进行侦察、勘测和巡逻，对于紧急情况还需进行群体作战与反攻。由于海上的恶劣环境严重影响了无人艇传感器的实时检测和目标识别，导致无法精准判断敌方艇的位置和航速，降低我方艇对敌方各艇的威胁度评估的准确性，使我方艇的任务调度无效。因此，如何在复杂海域中实现实时、精准的预测敌方艇的动作和状态，动态评估敌方艇的威胁程度，完成最优任务调度是目前亟待解决的首要难题。
[0003]现有的任务调度算法均存在任务处理时间长，实时性差及难以均衡多方约束导致陷入局部最优等问题。在处理集群对抗过程中的任务调度问题时，不能结合实际作战情况实时的进行任务分配决策，尚未综合考虑多个敌方目标的威胁程度，也会导致任务分配不当、浪费集体资源。故动态评估敌方艇的威胁程度是为了更好的完成我方艇的任务分配，结合我方艇的勘测范围和任务需求等约束条件，才能对我方艇进行最优的任务调度决策。
[0004]在无人系统集群博弈对抗过程中，通过不断优化我方艇的对抗策略提高我方博弈对抗的胜利率。初期，利用差分博弈或专家经验方法获取集群的最优策略，但该类传统方法的模型计算困难、泛化能力差，环境一旦变化，协同对抗任务便会失败。而其他传统机器...

【技术保护点】

【技术特征摘要】
1.一种基于MADDPG的无人艇集群任务调度与协同对抗方法，其特征在于，方法包括：构建无人艇集群博弈对抗环境，并确定无人艇集群博弈对抗规则；所述无人艇集群博弈对抗环境中包括我方艇和敌方艇；每个所述我方艇均包括策略网络和评价网络；所述策略网络用于根据我方艇的状态选取我方艇的动作；所述评价网络用于根据我方艇的动作计算我方艇的期望收益；针对任一我方艇，获取我方艇的我方探测数据和当前动作奖励；所述我方探测数据包括每个敌方艇的当前状态集；所述当前动作奖励是所述策略网络输出的我方艇的动作的奖励值；基于长短期记忆网络和每个敌方艇的当前状态集，预测每个敌方艇的下一状态集，然后根据每个敌方艇的下一状态集修正所述当前动作奖励，以得到初次修正奖励值；基于隶属度函数
‑
小波神经网络、每个敌方艇的当前状态集，确定对所述我方艇威胁最大的敌方艇，然后基于对所述我方艇威胁最大的敌方艇修正所述初次修正奖励值，以得到最终奖励值；以对我方艇威胁最大的敌方艇为所述我方艇的攻击目标，基于所述无人艇集群博弈对抗规则，确定每艘我方艇的任务分配和调度数据；所述我方艇的任务分配和调度数据包括我方艇的状态集、艇动作集、状态转移模型和累计折扣奖励的衰减系数；所述我方艇的任务分配和调度数据、所述我方艇的最终奖励值构成经验五元组；多艘我方艇对应的经验五元组构成经验池；采用优先经验回放方法从所述样本池中筛选数据样本，以得到样本集；利用所述样本集对所述评价网络进行训练并进行软更新，以得到我方艇集群的最优调度对抗策略。2.根据权利要求1所述的基于MADDPG的无人艇集群任务调度与协同对抗方法，其特征在于，所述无人艇集群博弈对抗环境中还包括我方艇的预设防守区域；所述无人艇集群博弈对抗规则，具体包括：当所述敌方艇处于所述我方艇的攻击范围内，且维持第一设定时间，或者，所述敌方艇与所述我方艇的攻击范围之间的距离，大于第一设定距离时，所述我方艇胜利；所述我方艇的攻击范围根据所述我方艇的预设攻击距离和预设攻击夹角确定；当所述我方艇处于所述敌方艇的攻击范围内，且维持第二设定时间，或者，所述敌方艇到达所述我方艇的预设防守区域内时，所述敌方艇胜利；所述敌方艇的攻击范围根据所述敌方艇的预设攻击距离和预设攻击夹角确定。3.根据权利要求1所述的基于MADDPG的无人艇集群任务调度与协同对抗方法，其特征在于，所述基于长短期记忆网络和每个敌方艇的当前状态集，预测每个敌方艇的下一状态集，然后根据每个敌方艇的下一状态集修正所述当前动作奖励，以得到初次修正奖励值，具体包括：从任一敌方艇的当前状态集中随机选取初始艇状态集；将所述初始艇状态集输入至所述策略网络，以得到对应的初始动作；获取所述我方艇执...

【专利技术属性】
技术研发人员：宋锐，黄梦蝶，罗均，彭艳，
申请(专利权)人：上海大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人