组内决策一致多群组博弈的纳什均衡指定时间搜索方法技术

技术编号:33426172 阅读:17 留言:0更新日期:2022-05-19 00:17
本发明专利技术提供了一种针对组内决策一致性约束下多群组博弈的指定时间收敛纳什均衡搜索方法,包括:根据多智能体系统构建多集群博弈问题模型,构建满足条件的通信拓扑结构,引入时间规划方法针对每个智能体设计连续时间分布式纳什均衡搜索方法,设计使得纳什均衡搜索方法实现指定时间收敛的相关参数。本发明专利技术针对组内决策一致性约束下的多群组博弈问题能够实现指定时间收敛纳什均衡搜索,为多无人集群系统在集群内部协同合作、各集群之间竞争博弈情形的决策提供了依据。情形的决策提供了依据。情形的决策提供了依据。

【技术实现步骤摘要】
组内决策一致多群组博弈的纳什均衡指定时间搜索方法


[0001]本专利技术属于通信技术,涉及多智能体博弈决策技术,具体涉及一种针对组内决策一致性约束下多群组博弈的指定时间收敛纳什均衡搜索方法。

技术介绍

[0002]随着人工智能的发展,无人化与智能化成为继机械化、信息化之后推动新一轮军事变革的强大动力,对战争形态产生冲击甚至颠覆性影响。未来军事作战中,将出现大规模的无人集群对抗无人集群的场景。然而,受限于通信时延,无人集群系统的通信拓扑层级不能无限延伸,从而限制了集群规模。可供解决的办法是研究多个无人集群系统,其中每个小规模无人集群系统视作一个集群,由多个这样的集群系统进行联合作战。由于多个无人集群系统任务的多样性及集群数量导致整个大系统动力学的复杂性,在实际中往往会存在任务的冲突性。此时,由于不存在全局的统一指挥者,各个无人集群之间存在着任务层面的合作与竞争关系,集群内部个体之间同样也存在合作与竞争关系。因此,亟需对这样的复杂多集群系统的多任务决策问题进行建模,通过其动力学分析演化机理,一方面为实际多无人集群系统多任务决策结果提出理论解释,另一方面用以指导多无人集群系统内部集群构架的设计与优化。现有的多集群博弈连续时间纳什均衡搜索算法中,文献(X.Zeng,S.Liang,and Y.Hong.Distributed variational equilibrium seeking of multi

coalition game via variational inequality approach.IFAC

PapersOnLine,,20th IFAC World Congress,50(1):940

945,2017.)针对一致性约束的多集群博弈问题,首先将多集群博弈的变分均衡寻求问题建模为一个分布式变分不等式问题,基于投影常微分方程的形式来求解分布式变分不等式,提出了一种新的分布式投影连续时间算法。该方案的局限性在于设计的均衡搜索算法要求集群具有相同数量的智能体且其拓扑结构相同。在此基础上,文献(X.Zeng,J.Chen,S.Liang,and Y.Hong.Generalized Nash equilibrium seeking strategy for distributed nonsmooth multi

cluster game.Automatica,2019,103:20

26.)进一步将其推广到不同拓扑结构集群图的情形,提出了一种利用投影微分包含的分布式非光滑算法,并分析了算法的收敛性。然而,该方案的实施依赖于无向拓扑,且文献中未具体分析算法的收敛速率。文献(X.Nian,F.Niu and Z.Yang.Distributed Nash Equilibrium Seeking for Multicluster Game Under Switching Communication Topologies.IEEE Transactions on Systems,Man,and Cybernetics:Systems,doi:10.1109/TSMC.2021.3090515.)在联合强连通的有向切换通信拓扑下,提出了一种新的基于一致性协议和梯度博弈规则的纳什均衡搜索算法,并使用领导

跟随一致性协议对集群中的所有智能体动作进行估计,从而设计了适用于智能体只知道部分决策信息的更通用的多集群博弈纳什均衡搜索算法,对于这两种算法,分别给出了局部收敛性和非局部收敛性的结果。然而,该方案未考虑集群内部的决策一致性约束。

技术实现思路

[0003]为解决上述问题,本专利技术提供了一种针对组内决策一致性约束下多群组博弈的连续时间纳什均衡搜索方法,利用时间规划方法实现指定时间的收敛。本方法考虑多个无人集群系统多任务联合作战的复杂场景,综合考虑各个无人集群系统内部的协同任务以及各个无人集群系统的作战任务,通过在多无人集群系统间及系统内部建立集群博弈模型,研究多任务集群博弈的均衡提供指定时间的快速求解方法,从集群博弈的角度为多无人集群系统多任务决策与控制问题提供解决思路。
[0004]为了达到上述目的,本专利技术提供如下技术方案:
[0005]一种针对组内决策一致性约束下多群组博弈的指定时间收敛纳什均衡搜索方法,包括如下步骤:
[0006]步骤1:针对多无人集群系统在集群内部协同合作、各集群之间竞争博弈的情形,为多智能体系统构建服从一致性约束集的多集群博弈模型;
[0007]步骤2:针对多智能体系统构建通信拓扑结构;
[0008]步骤3:基于时间规划方法,为每个智能体设计指定时间收敛的多任务集群博弈的均衡快速准确搜索方法。
[0009]步骤4:设计纳什均衡搜索方法实现指定时间收敛的参数条件。
[0010]进一步地,所述步骤1具体包括如下子步骤:
[0011]步骤1

1:针对多无人集群系统在内部协同任务与各个无人集群系统任务之间存在冲突性的情形,构建如下服从一致性约束集的多集群博弈模型:
[0012][0013][0014]其中,N为参与博弈的集群个数,集群i包含n
i
个智能体,为集群i的状态,编号ij表示集群i中的第j个智能体,为智能体ij的状态,为智能体ij的状态,表示所有集群的联合状态,集群的状态服从的一致性约束集为二次连续可微凸函数f
ij
(x)表示集群i中智能体j的代价函数,函数f
ij
(x)具有Lipschitz连续梯度:即对于任意满足其中l
ij
>0为Lipschitz常数。函数f
i
(x)为集群i的代价函数:
[0015]进一步地,所述步骤2具体包括如下子步骤:
[0016]步骤2

1:多智能体系统的通信拓扑结构描述如下:
[0017]将所有智能体间的通信拓扑建模为有向图节点集为边集合为N为参与博弈的集群个数。集群内部和不同集群间可在拓扑连边上进行有向通信。具体地,集群i包含n
i
个智能体,智能体集合表示为集群i内部的通信拓扑用诱导子图表示,编号ij表示集群i中的第j个
智能体,对于智能体定义其在网络中的入邻居集为定义其集群内的入邻居集合为其集群内的出邻居集合定义图的邻接矩阵为其中为矩阵A的第行列的元素,如果(pq,ij)∈ε,pq≠ij,则否则定义图的邻接矩阵为其中为矩阵A
i
的第j行l列的元素,如果(il,ij)∈ε
i
,j≠l,则否则显然,A1,...,A
N
为矩阵A的对角块。定义为图的拉普拉斯矩阵,其中为矩阵L的第行列的元素,如果ij=pq,则否则
[0018]步骤2

2:多智能体系统的通信拓扑结构要求如下:
[0019]通信图和通信子图均是强连通的。
[0020]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种组内决策一致多群组博弈的纳什均衡指定时间搜索方法,其特征在于,包括如下步骤:步骤1:针对多无人集群系统在集群内部协同合作、各集群之间竞争博弈的情形,为多智能体系统构建服从一致性约束集的多集群博弈模型;步骤2:针对多智能体系统构建通信拓扑结构;步骤3:结合时间规划方法,为每个智能体设计指定时间收敛的多任务集群博弈均衡快速准确搜索方法;步骤4:给出纳什均衡搜索方法实现指定时间收敛的参数条件。2.根据权利要求1所述的组内决策一致多群组博弈的纳什均衡指定时间搜索方法,其特征在于,所述步骤1具体包括如下子步骤:步骤1

1:针对多无人集群系统在集群内部协同合作、各集群之间竞争博弈的情形,构建如下的服从一致性约束集的多集群博弈模型:建如下的服从一致性约束集的多集群博弈模型:其中,N为参与博弈的集群个数,集群i包含n
i
个智能体,为集群i的状态,编号ij表示集群i中的第j个智能体,为智能体ij的状态,为智能体ij的状态,表示所有集群的联合状态,集群的状态服从的一致性约束集为二次连续可微凸函数f
ij
(x)表示集群i中智能体j的代价函数,函数f
ij
(x)具有Lipschitz连续梯度:即对于任意满足其中l
ij
>0为Lipschitz常数,函数f
i
(x)为集群i的代价函数:3.根据权利要求1所述的组内决策一致多群组博弈的纳什均衡指定时间搜索方法,其特征在于,所述步骤2具体包括如下子步骤:步骤2

1:多智能体系统的通信拓扑结构描述如下:将所有智能体间的通信拓扑建模为有向图节点集为边集合为N为参与博弈的集群个数,集群内部和不同集群间可在拓扑连边上进行有向通信,具体地,集群i包含n
i
个智能体,智能体集合表示为集群i内部的通信拓扑用诱导子图表示,编号ij表示集群i中的第j个智能体,对于智能体定义其在网络中的入邻居集为定义其集群内的入邻居集合为其集群内的出邻居集合定义图的邻接矩阵为其中为矩阵A的第行列的元素,如果(pq,ij)∈ε,pq≠ij,则否则定义图的邻接矩阵为
其中为矩阵A
i
的第j行l列的元素,如果(il,ij)∈ε
i
,j≠l,则否则显然,A1,...,A
N
为矩阵A的对角块,定义为图的拉普拉斯矩阵,其中为矩阵L的第行列的元素,如果ij=pq,则否则步骤2...

【专利技术属性】
技术研发人员:周佳玲栾萌吕跃祖温广辉
申请(专利权)人:吕跃祖温广辉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1