一种基于动态事件触发的航天器编队离散分布式非合作博弈方法技术

技术编号:27830003 阅读:38 留言:0更新日期:2021-03-30 11:29
本发明专利技术提供一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,包括如下步骤,步骤1构建航天器编队非合作博弈模型,个体航天器建立相邻航天器之间的通信连接,获取相邻航天器的状态信息;步骤2在航天器编队非合作博弈模型上建立分布式全局信息估计器,个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器编队的全局信息进行估计;步骤3根据个体航天对航天器编队的全局信息展开估计,建立航天器编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;步骤4基于动态事件触发机制所输出的全局信息估计数值设计纳什平衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。航天器编队离散分布式非合作博弈策略。航天器编队离散分布式非合作博弈策略。

【技术实现步骤摘要】
一种基于动态事件触发的航天器编队离散分布式非合作博弈方法


[0001]本专利技术涉及飞行器决策领域,具体为一种基于动态事件触发的航天器编 队离散分布式非合作博弈方法。

技术介绍

[0002]从20世纪90年代起,随着微小卫星和分布式空间系统等航天技术的发 展,航天器编队飞行技术的概念一经提出,便以其独特的优势成为目前航天 领域的研究热点。航天器编队具有功能多样化、成本低、可靠性高、扩展性 强等优点。近年来,随着在空间任务中国际合作越来越广泛,由多个国家组 成的大型航天器编队成为未来空间探索建设中主要发展趋势。因此,寻求一 种航天器编队的非合作博弈方法尤为重要。此外,在航天器编队执行任务过 程中,个体航天器之间需要进行频繁的信息交互,这往往要消耗大量的能量。 对于能量有限的航天器来说,设计一种信号传输协议,降低不必要的信号传 输,进而节约能量,显得尤其重要。
[0003]针对多智能体系统的非合作博弈策略,目前已经提出了多种求解方法。 常见的有基于梯度信息的纳什平衡连续求解方法、基于一致性协议的连续求 解方法。目前大部分实际系统中都采用数字信号传输与控制,然而以上求解 方法主要针对的是连续系统,不能适用于现代数字控制系统。因此,目前亟 需设计一种离散纳什平衡求解方法,便于工程实现。此外,事件触发机制广 泛应用于各类大型系统中,用以减少信号传输频率。目前,主要存在两类事 件触发机制:静态事件触发与动态事件触发。与前者相比,动态事件触发机 制具有更低的信号传输频率。然而,如何把动态事件触发机制与航天器编队 的非合作博弈策略相结合,设计一种基于动态事件触发的离散分布式非合作 博弈方法一直是目前的一个难题。本专利技术专利提出了一种基于动态事件触发 的离散分布式非合作博弈方法,既能保证纳什平衡点的求解,也能降低信号 传输频率,节约能量。

技术实现思路

[0004]针对现有技术中的航天器编队的非合作博弈策略无法与动态事件触发机 制相结合,则存在只能保证纳什平衡点的求解,无法降低信号传输频率和节 约能量的问题,本专利技术提供一种基于动态事件触发的航天器编队离散分布式 非合作博弈方法,该方法既能保证纳什平衡点的求解,也能降低信号传输频 率,节约能量。
[0005]本专利技术是通过以下技术方案来实现:
[0006]一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,包括 如下步骤,
[0007]步骤1,构建航天器编队非合作博弈模型,个体航天器建立相邻航天器 之间的通信连接,获取相邻航天器的状态信息;
[0008]步骤2,在航天器编队非合作博弈模型上建立分布式全局信息估计器, 个体航天
器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器 编队的全局信息进行估计;
[0009]步骤3,根据个体航天对航天器编队的全局信息展开估计,建立航天器 编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;
[0010]步骤4,基于动态事件触发机制所输出的全局信息估计数值设计纳什平 衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。
[0011]优选的,步骤1中,建立n个航天器编队的通信拓扑图模型其中V表示顶点组成的集合,V={v1,v2,

,v
n
}是由有限个顶点组成的集合,v
i
顶点表示第i个航天器;表示航天器之间通信的链路;为边集 合;A=[a
ij
]为权重邻接矩阵,通过通信拓扑图模型建立通信拓扑图模型 的Laplacian矩阵。
[0012]进一步的,通信拓扑图模型的Laplacian矩阵为L=D

A,其中,L为 通信拓扑图模型的Laplacian矩阵;D为对角矩阵,D=diag{d1,d2,

,d
n
},
ꢀꢀ
为第i个航天器的邻居航天器集合, A=[a
ij
]为权重邻接矩阵。
[0013]优选的,步骤1中,建立第i个航天器的成本函数J
i
(x
i
,x

i
),其中 J
i
(x
i
,x

i
)为已知的关于x
i
的严格凸函数,为第i个航天器的状态;表示实数域;n
i
为x
i
的维数;x

i
表示除了第i个航天器的状态的所有其他航 天器状态,即
[0014]优选的,步骤2中,定义为第i个航天器对第j个航天器状态的估计 值:
[0015][0016][0017]其中,指第i个航天器对其它航天器状态的估计值;为第i个航天器 对其它航天器状态的估计值加上自身状态值;k表示迭代步数,属于正整数 集。
[0018]进一步的,第i航天器估计其他航天的状态,建立如下状态估计器:
[0019][0020]其中,表示第j个航天器的邻居航天器经过通信网络收到的估计信息; 指第i个航天器对其它航天器状态的估计值;为第i个航天器对其它 航天器状态的估计值加上自身状态值;S
i
为一个实数矩阵;μ
k
为第k时刻的 步长,且满足如下条件:
[0021][0022]其中k表示迭代步数,属于正整数集。
[0023]更进一步的,S
i
的具体形式为:
[0024][0025]其中,n
<i
=∑
j<i n
j
,n
>i
=∑
j>i n
j
;S
i
为一个实数矩阵,n表示航天器 个数,I表示单位矩阵,0表示元素全部为零的矩阵。
[0026]优选的,步骤3中,对于第j个航天器,定义事件触发时刻序列为优选的,步骤3中,对于第j个航天器,定义事件触发时刻序列为对于第j个航天器的邻居航天器收到的第 j个航天器的估计值为:建立如下事件触发函数:
[0027][0028]其中,其中,表示第k

1步与第k步的状态误差;表 示触发阈值,k1为可调参数,ζ
j,k
为一个内部动态变量,为第i个航天器 对其它航天器状态的估计值加上自身状态值;表示第k

1步的信号传输 值;
[0029]通过引入ζ
j,k
可有效降低触发次数,且ζ
j,k
满足如下动态方程:
[0030][0031]其中,κ2为可调参数,e
j,k
为第j个航天器的传输估计值与实际估计值 在第k时刻的误差,即参数κ1和k2满足k1>1,>1,为了保证纳什求解策略收敛到纳什平衡点,触发阈值需满足如下不等 式:
[0032][0033]其中,β和δ为可调参数,满本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,包括如下步骤,步骤1,构建航天器编队非合作博弈模型,个体航天器建立相邻航天器之间的通信连接,获取相邻航天器的状态信息;步骤2,在航天器编队非合作博弈模型上建立分布式全局信息估计器,个体航天器建立与不相邻航天器之间的通信连接,个体航天器展开对航天器编队的全局信息进行估计;步骤3,根据个体航天对航天器编队的全局信息展开估计,建立航天器编队信号传输的动态事件触发机制,输出个体航天器对全局信息估计数值;步骤4,基于动态事件触发机制所输出的全局信息估计数值设计纳什平衡离散更新策略,完成航天器编队离散分布式非合作博弈策略。2.根据权利要求1所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,步骤1中,建立n个航天器编队的通信拓扑图模型其中表示顶点组成的集合,是由有限个顶点组成的集合,v
i
顶点表示第i个航天器;表示航天器之间通信的链路;为边集合;A=[a
ij
]为权重邻接矩阵,通过通信拓扑图模型建立通信拓扑图模型的Laplacian矩阵。3.根据权利要求2所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,通信拓扑图模型的Laplacian矩阵为L=D

A,其中,L为通信拓扑图模型的Laplacian矩阵;D为对角矩阵,D=diag{d1,d2,

,d
n
},},为第i个航天器的邻居航天器集合,A=[a
ij
]为权重邻接矩阵。4.根据权利要求1所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,步骤1中,建立第i个航天器的成本函数J
i
(x
i
,x

i
),其中J
i
(x
i
,x

i
)为已知的关于x
i
的严格凸函数,为第i个航天器的状态;表示实数域;n
i
为x
i
的维数;x

i
表示除了第i个航天器的状态的所有其他航天器状态,即5.根据权利要求1所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,步骤2中,定义为第i个航天器对第j个航天器状态的估计值:为第i个航天器对第j个航天器状态的估计值:其中,指第i个航天器对其它航天器状态的估计值;为第i个航天器对其它航天器状态的估计值加上自身状态值;k表示迭代步数,属于正整数集。6.根据权利要求5所述的一种基于动态事件触发的航天器编队离散分布式非合作博弈方法,其特征在于,第i航天器估计其他航天的状态,建立如下状态估计器:
其中,表示第j个航天器的邻居航天器经过通信网络收到的估计信息;指第i个航天器对其它航天器状态的估计值;为第i个航天器对其它航天器状态的估计值加上自身状态值;S
i
...

【专利技术属性】
技术研发人员:袁源张鹏孙冲
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1