一种基于博弈论的AUV水下集群攻防优化方法技术

技术编号：35037926 阅读：35 留言：0更新日期：2022-09-24 23:15

本发明专利技术公开了一种基于博弈论的AUV水下集群攻防优化方法，包括如下步骤：（1）、根据情景建立二维围捕或对抗模拟环境框架；（2）、让智能体与模拟环境进行实时交互产生数据，将产生的数据存入经验回放池直至填满；（3）、待经验回放池数据存储达到上限，采用GRU单元的值函数分解算法对智能体进行训练；（4）、将训练好的智能体放入环境中进行交互，得出训练结果。本发明专利技术解决了传统算法不能较好收敛的问题，针对传统协同对抗问题需要根据任务选择不同算法的局限，改进后的算法则具有较强的通用性，可以在不同的任务中使用，并都可以获得不错的效果。并都可以获得不错的效果。并都可以获得不错的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于博弈论的AUV水下集群攻防优化方法

[0001]本专利技术涉及计算机算法领域，尤其涉及一种基于博弈论的AUV水下集群攻防优化方法。

技术介绍

[0002]自主式水下机器人(Autonomous Underwater Vehicle,AUV)凭借着其成本效益高、机动性强、部署灵活以及能独立完成水下自主任务等特点成为各国研究的热点。目前，单AUV能在水下执行各种任务，如资源勘探，水下通信，侦察与反侦察，但在面对复杂作战任务时，单AUV的作战性能就急剧下降。例如，如果要在海底对不明高速移动物体进行捕获，单AUV就只能凭借自身的基础性能来对目标进行追击。如果在性能上不占优势，捕获任务几乎不可能完成。要解决这类问题，就需要在AUV硬件性能或围捕策略上进行研究。在不增加额外成本的前提下，要克服AUV单体性能不足的缺陷，使用集群攻防优化算法是目前较为理想的选择。
[0003]近年来的研究，考虑到陆地和空中通信条件较为良好和智能体易于控制等相关因素，陆地或空中智能体的相关集群攻防文献较为丰富，而水下AUV集群攻防的研究则相对滞后。所以研究水下集群攻防策略对未来增强国家海洋实力有着极为深远的战略意义。
[0004]为了合理给这些AUV配置任务，在过去人们通常采用传统的协同控制方法。传统的无人机协同控制方法包括精确的优化算法和启发式算法，精确的优化算法如分支定界法(BAB)、动态规划(DP)能够获得较为精确的结果。然而当问题变得复杂起来时，如约束条件增大，求解难度便会迅速增大。传统的启发式算法，如基于鸟类觅食现象...

【技术保护点】

【技术特征摘要】
1.一种基于博弈论的AUV水下集群攻防优化方法，其特征在于包括如下步骤：(1)、根据情景建立二维围捕或对抗模拟环境框架；(2)、让智能体与模拟环境进行实时交互产生数据，将产生的数据存入经验回放池直至填满；(3)、待经验回放池数据存储达到上限，采用GRU单元的值函数分解算法对智能体进行训练；(4)、最终将训练好的智能体放入环境中进行交互，再把交互的结果与传统的算法进行对比，进行分析；分析完成后，比较差异性和稳定性；得出基于博弈论的AUV水下集群攻防优化方法获得更优的结果。2.根据权利要求1所述的一种基于博弈论的AUV水下集群攻防优化方法，其特征在于：所述步骤(1)中二维围捕和对抗环境框架，采用栅格法将智能体工作的空间分割为网格，智能体收集到的信息会反映在网格上，然后根据网格的连同状态来确定所要到达的目标网格的最优路径。3.根据权利要求1所述的一种基于博弈论的AUV水下集群攻防优化方法，其特征在于：所述步骤(2)中的经验回放池，是在程序中建立一个容量为N的双向数组来存取智能体与环境交互时产生的数据(s
t
,a
t
,r
t
,s
t+1
)，被称为经验回放数组。4.根据权利要求3所述的一种基于博弈论的AUV水下集群攻防优化方法，其...

【专利技术属性】
技术研发人员：韩光洁，冯子骁，王皓，
申请(专利权)人：河海大学常州校区，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人