System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种无人集群围猎方法、系统、电子设备及存储介质技术方案_技高网

一种无人集群围猎方法、系统、电子设备及存储介质技术方案

技术编号:40922428 阅读:2 留言:0更新日期:2024-04-18 14:46
本发明专利技术提供一种无人集群围猎方法、系统、电子设备及存储介质。其中,方法包括:根据友方无人机的本地特征、扩展特征和观测特征,设计状态空间;友方无人机是通过运动方向和加速度调整各自的速度和方向;根据所述加速度和方向设计动作空间;设计友方无人机的接近奖励、捕获奖励和逃逸奖励的奖励函数;MADDPG算法采用Actor‑Critic框架;Actor网络通过友方无人机的状态空间的观测特征来计算无人机的确定性策略;Critic网络根据所述奖励函数评估友方无人机的执行动作的优劣,以此来改进Actor网络。本发明专利技术提出的方案能够根据态势为围猎无人机动态规划路径,并且根据充足的条件判定围猎成功与否。

【技术实现步骤摘要】

本专利技术属于人工智能应用,尤其涉及一种无人集群围猎方法、系统、电子设备及存储介质


技术介绍

1、(1)基于改进k-means算法的无人机集群围猎策略

2、大规模的路径规划问题结构复杂、解算难度大,为了得到较高的围猎效率,减少单机计算量,该方法采用混合式的体系结构将复杂的多目标围猎问题逐步分解为uav个体需要执行的任务集合,降低了系统的耦合性和任务解算的复杂度。该策略利用改进的k-means算法将多目标围猎问题分层,形成多个独立的单目标围猎子系统。在子系统内部将单目标围猎任务分解为多个uav容易执行的子任务,并以总时最短机制在子任务和uav之间建立一一对应的匹配关系,各uav只需执行待执行的子任务即可达到多目标围猎的目的。该方法虽然为围猎无人机分配了较优的逃逸目标,但围猎无人机之间缺少配合,无法形成有效的围猎包围圈。

3、(2)基于事件驱动的无人机集群围猎控制方法研究

4、该方法利用方位信息,针对静止目标的环航围捕控制策略。首先从静止目标着手,利用方位刚性理论,将多机环航围捕问题转化为一个目标编队实现问题。然后在此基础上,设计了只利用方位信息的环航围捕控制算法。同时,基于网络化多机对目标距离和速度的协同估计,提出了利用方位信息,针对运动目标的多机环航围捕控制策略。借助无人机机载惯导设备,设计了局部无人机网络利用自身速度和方位信息协同估计目标距离和速度的算法,并从理论上探讨了目标速度可估计的多智能体网络拓扑条件。在此基础上,将静止目标的环航围捕算法扩展到跟踪运动目标的环航围捕控制策略中。但是由于任务数量、无人机资源及面向资源消耗最少的目标以及算法自身的时间复杂度局限,该方法难以取得较优的围猎方案。其不足具体表现是:初始时基于任务的距离远近进行的目标分配和路径规划,没有考虑所有任务的整体情况,导致搜索的结果实质陷入局部最优,确定的围猎路径灵活性较差。

5、目前为止,关于无人集群围猎方法概括为以上二种方法,第一种方法无法形成有效的围猎包围圈,而第二种方法对通信效果要求高,不适用于动态复杂的变化场景。

6、以上技术问题亟待解决。


技术实现思路

1、为解决上述技术问题,本专利技术提出一种无人集群围猎方法的技术方案,以解决上述技术问题。

2、本专利技术第一方面公开了一种无人集群围猎方法,所述方法包括:

3、步骤s1、将集群中的无人机看作质点运动模型,使用运动方向和加速度来控制无人机的运动过程;

4、步骤s2、定义友方无人机和敌方无人机,即逃逸无人机;根据友方无人机的本地特征、扩展特征和观测特征,设计状态空间;

5、步骤s3、设定逃逸无人机是保持固定速度;围猎无人机,即友方无人机是通过运动方向和加速度调整各自的速度和方向;根据所述加速度和方向设计动作空间;

6、步骤s4、设计围猎无人机的接近奖励、捕获奖励和逃逸奖励的奖励函数;

7、步骤s5、maddpg算法采用actor-critic框架;actor网络通过友方无人机的状态空间的观测特征来计算无人机的确定性策略,即运动方向和加速度调整各自的速度和方向;critic网络根据所述奖励函数评估友方无人机的执行动作的优劣,以此来改进actor网络。

8、根据本专利技术第一方面的方法,在所述步骤s1中,所述质点运动模型为:

9、vt+1=vt+αt

10、

11、其中,vt和αt表示无人机在t时刻的速度和加速度,vt+1表示无人机在t+1时刻的速度,xt和xt+1表示无人机在t时刻和t+1时刻x轴正向的位移,yt和yt+1表示无人机在t时刻和t+1时刻y轴正向的位移,θt表示无人机在t时刻运动方向和x轴正向的夹角。

12、根据本专利技术第一方面的方法,在所述步骤s2中,所述本地特征oloci包括:逃逸目标,逃逸无人机即相对于围猎无人机i的舷角qi,m和剩余捕获距离di=di,m-dcap;

13、其中,di,m表示执行完一个动作后围猎无人机i与逃逸目标的距离;dcap表示捕获距离;

14、所述扩展特征oexti包括:围猎无人机i与相邻围猎无人机形成的捕获角差δai=|ai,j|-|ai,k|;所有无人机剩余捕获距离的均值

15、其中ai,j表示围猎无人机i与围猎无人机j之间的围捕角;ai,k表示围猎无人机i与围猎无人机k之间的围捕角;

16、所述观测特征oi,j包括:围猎无人机i与围猎无人机j之间的距离di,j,相互间的舷角qi,j和qj,i,剩余捕获距离差δdi,j=di-dj,围捕角αi,j。

17、根据本专利技术第一方面的方法,在所述步骤s2中,所述状态空间为:

18、

19、

20、其中,oi表示围猎无人机i的本地特征。

21、根据本专利技术第一方面的方法,在所述步骤s3中,所述根据所述加速度和方向设计动作空间的方法包括:

22、根据所述质点运动模型得到加速度和方向;

23、根据所述加速度和方向设计动作空间a={θt,αt}。

24、根据本专利技术第一方面的方法,在所述步骤s4中,所述接近奖励rappro为:rappro=-k1(d′i,m-di,m),围猎无人机i执行动作前到逃逸目标的距离与执行后到逃逸目标的距离做差,如果距离变近,则给予围猎无人机i正奖励,反之则为负奖励;

25、捕获奖励rcap为:若逃逸无人机处在由围猎无人机i及相邻围猎无人机构成的多边形内,且满足对于每个围猎无人机都构成所述多边形,有di,m<dmax,则所有围猎无人机获得一次性奖励,同时任务结束,其中dmax表示捕获距离阈值;

26、逃逸奖励rescape为:若逃逸无人机与所有围猎无人机的距离均满足di,m>dmax,则围猎失败,所有围猎无人机获得负奖励。

27、根据本专利技术第一方面的方法,在所述步骤s5中,所述方法还包括:

28、maddpg算法采用中心化训练,去中心化执行的方法训练无人集群,各个无人机训练时采用全局信息规划围猎路径,执行时采用局部信息规划围猎路径。

29、本专利技术第二方面公开了一种无人集群围猎系统,所述系统包括:

30、第一处理模块,被配置为,将集群中的无人机看作质点运动模型,使用运动方向和加速度来控制无人机的运动过程;

31、第二处理模块,被配置为,定义友方无人机和敌方无人机,即逃逸无人机;根据友方无人机的本地特征、扩展特征和观测特征,设计状态空间;

32、第三处理模块,被配置为,设定逃逸无人机是保持固定速度;围猎无人机,即友方无人机是通过运动方向和加速度调整各自的速度和方向;根据所述加速度和方向设计动作空间;

33、第四处理模块,被配置为,设计围猎无人机的接近奖励、捕获奖励和逃逸奖励的奖励函数;

34、第五处理模块,被配置为,maddpg算法采用ac本文档来自技高网...

【技术保护点】

1.一种无人集群围猎方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种无人集群围猎方法,其特征在于,在所述步骤S1中,所述质点运动模型为:

3.根据权利要求1所述的一种无人集群围猎方法,其特征在于,在所述步骤S2中,所述本地特征oloci包括:逃逸目标,逃逸无人机即相对于围猎无人机i的舷角Qi,M和剩余捕获距离di=di,M-dcap;

4.根据权利要求3所述的一种无人集群围猎方法,其特征在于,在所述步骤S2中,所述状态空间为:

5.根据权利要求2所述的一种无人集群围猎方法,其特征在于,在所述步骤S3中,所述根据所述加速度和方向设计动作空间的方法包括:

6.根据权利要求3所述的一种无人集群围猎方法,其特征在于,在所述步骤S4中,所述接近奖励rappro为:rappro=-k1(d′i,M-di,M),围猎无人机i执行动作前到逃逸目标的距离与执行后到逃逸目标的距离做差,如果距离变近,则给予围猎无人机i正奖励,反之则为负奖励;

7.根据权利要求1所述的一种无人集群围猎方法,其特征在于,在所述步骤S5中,所述方法还包括:

8.一种用于无人集群围猎系统,其特征在于,所述系统包括:

9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至7中任一项所述的一种无人集群围猎方法中的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1至7中任一项所述的一种无人集群围猎方法中的步骤。

...

【技术特征摘要】

1.一种无人集群围猎方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种无人集群围猎方法,其特征在于,在所述步骤s1中,所述质点运动模型为:

3.根据权利要求1所述的一种无人集群围猎方法,其特征在于,在所述步骤s2中,所述本地特征oloci包括:逃逸目标,逃逸无人机即相对于围猎无人机i的舷角qi,m和剩余捕获距离di=di,m-dcap;

4.根据权利要求3所述的一种无人集群围猎方法,其特征在于,在所述步骤s2中,所述状态空间为:

5.根据权利要求2所述的一种无人集群围猎方法,其特征在于,在所述步骤s3中,所述根据所述加速度和方向设计动作空间的方法包括:

6.根据权利要求3所述的一种无人集群围猎方法,其特征在于,在所述步骤s4中,所述接近奖励rappro为:...

【专利技术属性】
技术研发人员:吴娴王坤福何晓陈梦楠张军敏
申请(专利权)人:中国船舶集团有限公司系统工程研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1