基于规定时间纳什均衡寻找的无人机追逃博弈方法技术

技术编号：40012094 阅读：4 留言：0更新日期：2024-01-16 15:26

本发明专利技术公开了一种基于规定时间纳什均衡(PTNE)寻找的无人机追逃博弈(PEG)方法，旨在解决追逐‑逃避游戏中的多个追逐者与逃避者之间的博弈问题。该方法首先建立追逐‑逃避游戏的无人机运动的二阶动力学方程，然后提出无人机的通信图，并设计追逐者的收益函数，再提出无人机追逃博弈的纳什均衡定义以及引理条件，设计在规定时间内实现达到追逃博弈纳什均衡的收敛算法并给出算法收敛的前提条件；最后证明收敛算法的收敛性。本发明专利技术设计的分布式算法，通过自适应调整控制方案参数，可以在PTNE下实现PEG。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于控制系统和智能体博弈论领域，主要涉及具有二阶动力学的无人机智能体的追逐-逃避博弈(peg)的预设规定时间纳什均衡寻求方法的开发。

技术介绍

1、追逃博弈由两组智能体组成，分别为逃避者和追捕者。追捕者的目标是通过合作抓住逃避者，而逃避者则努力逃避追捕。peg是一个经典的非合作博弈。由于其广泛的应用场景，如智能电网、编队控制、航天器交会等，引起了人们的广泛关注。值得注意的是，大多数关于寻求博弈纳什均衡的研究都集中在渐近和指数收敛上，其中没有智能体没有改变其行为的动机。但在真实的场景中,实现纳什均衡在一个有限的时间是有价值且实用的。与渐近收敛和指数收敛相比，有限时间收敛可以加快纳什均衡搜索算法的速度，并具有更好的抗干扰性能。因此针在追逃博弈问题，在规定时间内寻求纳什均衡的研究是一个具有挑战性且有意义的问题。

技术实现思路

1、专利技术目的：针对现有技术的不足，本专利技术开发了一种在规定时间内实现追逃博弈的方法，该方法可以实现预先给定和用户自定义的追逃博弈的收敛时间。

2、技术方案：为了实现上述专利技术目的，本专利技术采用的技术方案为：

3、一种基于规定时间纳什均衡寻找的无人机追逃博弈方法，首先建立无人机智能体运动的二阶动力学方程，其次定义智能体的通信图。考虑到智能体的速度和位置信息，优化智能体的收益函数。提出引理条件和假设条件，并根据引理条件和假设条件提出在规定时间内实现追逃博弈的算法，以及算法收敛的前提条件。根据前提假设条件和lyapunov函数进

4、步骤1:建立一个追逐-逃避游戏的无人机运动的二阶动力学方程，这个方程描述了系统中各个元素之间的动态关系；

5、步骤2:提出无人机的通信图，以确定各个无人机之间的通信关系；

6、步骤3:根据步骤1中建立的无人机运动的二阶动力学方程和步骤2提出的无人机的通信图，设计追逐者的收益函数，并在收益函数中考虑无人机的位置和速度；

7、步骤4:根据步骤3所设计追逐者的收益函数，提出无人机追逃博弈的纳什均衡定义以及引理条件，控制输入假设和通信图假设条件；

8、步骤5:根据步骤1中建立的无人机运动的二阶动力学方程和步骤4中提出的无人机追逃博弈的纳什均衡定义，设计在规定时间内实现达到追逃博弈纳什均衡的收敛算法；

9、步骤6:根据步骤4提出的控制输入假设和通信图假设，给出步骤5中提出的追逃博弈纳什均衡算法收敛的前提条件；

10、步骤7:根据步骤4提出的控制输入假设和通信图假设以及步骤6给出的前提条件，证明步骤5中提出的收敛算法的收敛性。

11、进一步地，步骤1中建立无人机运动的二阶动力学方程模型，具体为：

12、

13、对于追逐-逃避游戏中无人机集合是追逐者集合，是逃避者集合，其中是控制输入、位置和速度；若有m个逃避者情形时，可以将其分解为m个有多个追逐者和1个逃避者的集合问题，对于i∈{1,2,…,n}，定义ui，xi，vi为第i个追逐者的控制输入、位置和速度，n为追逐者的数量，另外，将un+1，xn+1，vn+1分别表示逃避者的控制输入、位置和速度。

14、进一步地，步骤2所述提出无人机的通信图以及矩阵运算具体包括如下步骤：

15、步骤2-1.定义无人机通信图为无向图：

16、

17、其中，表示点集合，ε表示边集合，表示无人机通信图；

18、步骤2-2.提出针对连接的无向图的邻接矩阵：

19、

20、其中，为邻接矩阵，akj是邻接矩阵中的参数，表示邻接矩阵的第k行第j列，若(k,j)∈ε，则akj＝1；反之akj＝0；

21、步骤2-3.提出拉普拉斯矩阵：

22、

23、其中，为拉普拉斯矩阵，lkj是拉普拉斯矩阵的参数，表示拉普拉斯矩阵的第k行第j列，若k≠j，则lkj＝-akj。

24、进一步地，步骤3所述依据逃避者策略优化追逐者的收益函数，并在收益函数中考虑智能体的位置和速度，具体为：

25、

26、其中，ji是第i个追逐者的收益函数，ei是第i个追逐者位置和速度的集合，称为策略集合，xi是第i个追逐者的位置，vi是第i个追逐者的速度，e-i＝(x-i,v-i)是除第i个追逐者之外的所有无人机的位置和速度的集合，其中，x-i＝(x1,…,xi-1,xi+1,…,xn+1)是除第i个追逐者之外的所有无人机的位置的集合，v-i＝(v1,…,vi-1,vi+1,…,vn+1)是除第i个追逐者之外的所有无人机的速度的集合。

27、进一步地，步骤4所述提出纳什均衡定义以及引理条件和假设条件，包括；

28、步骤4-1.提出纳什均衡定义，具体为：

29、

30、对于一个博弈ωi是博弈中第i个追逐者策略集合的定义域，ei是第i个追逐者策略集合，是第i个追逐者的最优策略集合，是除第i个追逐者以外所有无人机的最优策略集合，这个策略集合就是博弈gpe的纳什均衡；

31、步骤4-2.提出收益函数引理，具体为：

32、对于每一个ei∈ωi，收益函数ji(ei,e-i)＝ji(xi,x-i,vi,v-i)在它的定义域中是c2，并且对于每个对象都是严格凸的和径向无界的，其中，cm表示m次连续可微的函数集合；

33、步骤4-3.表明纳什均衡唯一存在以及满足的条件，具体为：

34、对于纳什均衡，没有任何主题有动机单方面偏离它们的行为，经检验，所得收益函数满足收益函数引理中的条件，这说明纳什均衡是唯一存在的，

35、进一步，纳什均衡满足：

36、

37、其中，这表示代表第i个追逐者根据自身行为所获得的不同收益的梯度；

38、步骤4-4.提出通信图假设，即n个追逐者与1个逃避者的无向通信图是连接的，具体为：

39、

40、diag(a1(n+1),a2(n+1),…,an(n+1))表示由元素a1(n+1),a2(n+1),...,an(n+1)组成的对角矩阵，记作n个追逐者和1个逃避者的拉普拉斯矩阵为其中，是追逐者和逃避者的连接关系矩阵，n个追逐者的拉普拉斯矩阵为代表q×p维度的实数向量空间；

41、步骤4-5.提出逃避者的控制输入假设和高增益函数，具体为：

42、控制输入假设说明逃避者控制输入的导数是有界的，即存在一个正常数满足高增益函数θι(t)表示为：

43、

44、

45、其中，ι是正整数，c是高增益函数的静态增益，ts是人为规定的收敛时间，ι＝1,2，c＞1，ts＞0；

46、步骤4-6.提出拉普拉斯矩阵引理，具体为：

47、基于通信图假设，得到是正定且对称，可以找到一个向量δ＝(δ1,δ2,…,δn)t满足上标t表示矩阵的转置；本文档来自技高网...

【技术保护点】

1.一种基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，步骤1中建立无人机运动的二阶动力学方程模型，具体为：

3.根据权利要求2所述的基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，步骤2所述提出无人机的通信图以及矩阵运算具体包括如下步骤：

4.根据权利要求3所述的基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，步骤3所述依据逃避者策略优化追逐者的收益函数，并在收益函数中考虑智能体的位置和速度，具体为：

5.根据权利要求4所述的基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，步骤4所述提出纳什均衡定义以及引理条件和假设条件，包括；

6.根据权利要求1所述的基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，步骤5中，设计规定时间内实现追逃博弈的收敛算法的控制器，具体包括以下步骤：

7.根据权利要求4所述的基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，

8.根据权利要求1所述的基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，步骤7中，基于控制输入假设和通信图假设以及前提条件，证明控制算法的有效性,具体为：

...

【技术特征摘要】

1.一种基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的基于规定时间纳什均衡寻找的无人机追逃博弈方法，其特征在于，步骤1中建立无人机运动的二阶动力学方程模型，具体为：

5.根据权利要求4所述的基...

【专利技术属性】
技术研发人员：叶剑锋，俞贤，薛磊，武永宝，刘剑，孙长银，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人