基于动态博弈的飞行器集群对抗方法及相关装置制造方法及图纸

技术编号:38823039 阅读:13 留言:0更新日期:2023-09-15 20:02
本发明专利技术涉及飞行器技术领域,提供一种基于动态博弈的飞行器集群对抗方法及相关装置。按照防御方任务确定每个防御方飞行器的第一目标函数,并按照入侵方任务确定每个入侵方飞行器的第二目标函数,且第二目标函数表示入侵方飞行器的行动控制变量与其总任务成本的关系,得到飞行器集群的博弈对抗函数组,再基于每个防御方飞行器的初始飞行状态、每个入侵方飞行器的初始飞行状态和保护区域的区域信息,求解函数组的纳什均衡策略集,得到每个防御方飞行器的最优行动策略和每个入侵方飞行器的最优行动策略,以使每个防御方飞行器和每个入侵方飞行器按照自身的最优行动策略进行实时对抗。提高了对入侵方的干扰效率并提高了飞行器执行防御任务的成功率。行防御任务的成功率。行防御任务的成功率。

【技术实现步骤摘要】
基于动态博弈的飞行器集群对抗方法及相关装置


[0001]本专利技术涉及飞行器
,具体而言,涉及一种基于动态博弈的飞行器集群对抗方法及相关装置。

技术介绍

[0002]近年来,飞行器性能不断提升,种类日益多样化,在服务保障、安全保卫、环境监测等方面都得到了广泛应用。由于单个飞行器的载荷能力有限,难以独立完成任务,近年来陆续提出了飞行器集群对抗的新型作战模式。作为未来作战的重要样式,飞行器集群对抗就是一类典型的多智能体任务,其将飞行器集群编队视为一个多智能体系统。飞行器集群对抗问题一般分为追逃问题、拦截问题、围捕问题和驱离问题四大类,主要是关注追捕方

逃跑方(防御方

入侵方)双方在不同的任务场景下如何进行对抗策略。博弈论易于建立不同博弈者之间的策略交互模型,且博弈者的策略选择过程即是系统内部的合作或竞争过程。因此,利用博弈理论研究飞行器集群对抗问题逐渐成为此领域研究热点。
[0003]目前常见的追逃微分博弈策略中,通常是将微分博弈理论与任务分配算法相结合来研究多个追捕者、多个逃跑者的防御问题,进而求解追逃双方的最优策略。但是其无法在博弈者数量、状态维度之间进行良好的拓展,在导弹打击、飞行器对抗等场景中无法根据敌我双方数量和战场实时环境进行灵活的对抗策略变通。并且当博弈者数量多时,求解较为困难,无法满足博弈对抗实时性的需求。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种基于动态博弈的飞行器集群对抗方法及相关装置。
[0005]为了实现上述目的,本专利技术采用的技术方案如下:
[0006]第一方面,本专利技术提供一种基于动态博弈的飞行器集群对抗方法,所述基于动态博弈的飞行器集群对抗方法包括:
[0007]按照防御方任务,确定每个防御方飞行器的第一目标函数;所述第一目标函数表示所述防御方飞行器的行动控制变量与其总任务成本的关系;
[0008]按照入侵方任务,确定每个入侵方飞行器的第二目标函数,得到包括每个所述第一目标函数和每个所述第二目标函数的函数组;所述第二目标函数表示所述入侵方飞行器的行动控制变量与其总任务成本的关系,所述函数组表示全部防御方飞行器与全部入侵方飞行器所组成的飞行器集群的博弈对抗函数;
[0009]基于每个所述防御方飞行器的初始飞行状态、每个所述入侵方飞行器的初始飞行状态和保护区域的区域信息,求解所述函数组的纳什均衡策略集,得到每个所述防御方飞行器的最优行动策略和每个所述入侵方飞行器的最优行动策略,以使每个所述防御方飞行器和每个所述入侵方飞行器按照自身的最优行动策略进行实时对抗。
[0010]在可选的实施方式中,所述防御方任务为防御方飞行器跟踪入侵方飞行器并对入
侵方飞行器进行持续干扰攻击;
[0011]所述按照防御方任务,确定每个防御方飞行器的第一目标函数的步骤,包括:
[0012]对于每个所述防御方飞行器,基于预设的跟踪激励规则、能耗约束条件、安全边界约束条件和攻击激励规则,确定所述防御方飞行器的成本函数,所述防御方飞行器的成本函数表示所述防御方飞行器每个时刻的行动控制变量与其任务成本的关系;
[0013]基于预设博弈时长和所述防御方飞行器的成本函数,确定所述防御方飞行器的第一目标函数,获得每个所述防御方飞行器的第一目标函数。
[0014]在可选的实施方式中,所述防御方飞行器的成本函数的表达式如下:
[0015][0016][0017]其中,g
i
(t,u
1:
(t))表示第i个防御方飞行器的成本函数;t表示时刻;N表示飞行器集群中飞行器的总数;u
1:
(t)表示飞行器集群中每个飞行器在t时刻的行动控制变量;N1表示防御方飞行器的总数;s
Dgoal
表示第i个防御方飞行器与其跟踪的目标入侵方飞行器的距离向量;(s
Dgoal
)
T
表示s
Dgoal
的转置;Q
i
(t)表示第i个防御方飞行器在t时刻的第一正定矩阵;表示第i个防御方飞行器的能耗激励参数;u
h
(t)表示飞行器集群中第h个飞行器在t时刻的行动控制变量;[u
h
(t)]T
表示u
h
(t)的转置;R
h
()表示飞行器集群中第h个飞行器在t时刻的第二正定矩阵;表示第i个防御方飞行器与其他防御方飞行器的安全边界距离;表示第i个防御方飞行器的安全边界距离激励参数;表示第i个防御方飞行器的攻击激励参数;Q表示三维任务空间;q表示目标入侵方飞行器在三维任务空间中的位置;φ(q,t)表示目标入侵方飞行器在t时刻的位置概率密度函数;P(q)表示第i个防御方飞行器与其他防御方飞行器对目标入侵方飞行器的联合攻击概率;
[0018]所述防御方飞行器的第一目标函数的表达式如下:
[0019][0020]其中,J
i
表示第i个防御方飞行器的第一目标函数;t
s
表示预设博弈时长。
[0021]在可选的实施方式中,所述联合攻击概率的表达式如下:
[0022][0023][0024]其中,P(q)表示M个防御方飞行器对目标入侵方飞行器的联合攻击概率,且M个防御方飞行器包括第i个防御方飞行器;Q
k
表示第k个防御方飞行器的攻击范围;R表示攻击半
径上限值;Θ表示攻击水平角度上限值;Ψ表示攻击俯仰角度上限值;d
k
表示第k个防御方飞行器与目标入侵方飞行器的距离差;α
k
表示第k个防御方飞行器与目标入侵方飞行器的水平角度差;表示第k个防御方飞行器与目标入侵方飞行器的俯仰角度差。
[0025]在可选的实施方式中,所述入侵方任务为入侵方飞行器进入保护区域并逃离防御方飞行器的追踪;
[0026]所述按照入侵方任务,确定每个入侵方飞行器的第二目标函数的步骤,包括:
[0027]对于每个所述入侵方飞行器,基于预设的入侵激励规则、能耗约束条件、安全边界约束条件和逃离激励规则,确定所述入侵方飞行器的成本函数,所述入侵方飞行器的成本函数表示所述入侵方飞行器每个时刻的行动控制变量与其任务成本的关系;
[0028]基于预设博弈时长和所述入侵方飞行器的成本函数,确定所述入侵方飞行器的第二目标函数,获得每个所述入侵方飞行器的第二目标函数。
[0029]在可选的实施方式中,所述入侵方飞行器的成本函数的表达式如下:
[0030][0031][0032]其中,g
j
(t,u
1:
())表示第j个入侵方飞行器的成本函数;t表示时刻;N表示飞行器集群中飞行器的总数;u
1:
(t)表示飞行器集群中每个飞行器在t时刻的行动控制变量;N2表示入侵方飞行器的总数;s
Igoal
表示第j个入侵方飞行器与保护区域的距离向量;(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态博弈的飞行器集群对抗方法,其特征在于,所述基于动态博弈的飞行器集群对抗方法包括:按照防御方任务,确定每个防御方飞行器的第一目标函数;所述第一目标函数表示所述防御方飞行器的行动控制变量与其总任务成本的关系;按照入侵方任务,确定每个入侵方飞行器的第二目标函数,得到包括每个所述第一目标函数和每个所述第二目标函数的函数组;所述第二目标函数表示所述入侵方飞行器的行动控制变量与其总任务成本的关系,所述函数组表示全部防御方飞行器与全部入侵方飞行器所组成的飞行器集群的博弈对抗函数;基于每个所述防御方飞行器的初始飞行状态、每个所述入侵方飞行器的初始飞行状态和保护区域的区域信息,求解所述函数组的纳什均衡策略集,得到每个所述防御方飞行器的最优行动策略和每个所述入侵方飞行器的最优行动策略,以使每个所述防御方飞行器和每个所述入侵方飞行器按照自身的最优行动策略进行实时对抗。2.根据权利要求1所述的基于动态博弈的飞行器集群对抗方法,其特征在于,所述防御方任务为防御方飞行器跟踪入侵方飞行器并对入侵方飞行器进行持续干扰攻击;所述按照防御方任务,确定每个防御方飞行器的第一目标函数的步骤,包括:对于每个所述防御方飞行器,基于预设的跟踪激励规则、能耗约束条件、安全边界约束条件和攻击激励规则,确定所述防御方飞行器的成本函数,所述防御方飞行器的成本函数表示所述防御方飞行器每个时刻的行动控制变量与其任务成本的关系;基于预设博弈时长和所述防御方飞行器的成本函数,确定所述防御方飞行器的第一目标函数,获得每个所述防御方飞行器的第一目标函数。3.根据权利要求2所述的基于动态博弈的飞行器集群对抗方法,其特征在于,所述防御方飞行器的成本函数的表达式如下:u
1:
(t)≡(u1(t),2(t),

,
N
(t)),其中,g
i
(t,u
1:
(t))表示第i个防御方飞行器的成本函数;t表示时刻;N表示飞行器集群中飞行器的总数;u
1:
(t)表示飞行器集群中每个飞行器在t时刻的行动控制变量;N1表示防御方飞行器的总数;s
Dgoal
表示第i个防御方飞行器与其跟踪的目标入侵方飞行器的距离向量;(s
Dgoal
)
T
表示s
Dgoal
的转置;Q
i
(t)表示第i个防御方飞行器在t时刻的第一正定矩阵;表示第i个防御方飞行器的能耗激励参数;
h
(t)表示飞行器集群中第h个飞行器在t时刻的行动控制变量;[u
h
(t)]
T
表示u
h
(t)的转置;R
h
()表示飞行器集群中第h个飞行器在t时刻的第二正定矩阵;表示第i个防御方飞行器与其他防御方飞行器的安全边界距离;表示第i个防御方飞行器的安全边界距离激励参数;表示第i个防御方飞行器的攻击激励参数;Q表示三维任务空间;q表示目标入侵方飞行器在三维任务空间中的位置;φ(q,t)表示
目标入侵方飞行器在t时刻的位置概率密度函数;P(q)表示第i个防御方飞行器与其他防御方飞行器对目标入侵方飞行器的联合攻击概率;所述防御方飞行器的第一目标函数的表达式如下:其中,J
i
表示第i个防御方飞行器的第一目标函数;t
s
表示预设博弈时长。4.根据权利要求3所述的基于动态博弈的飞行器集群对抗方法,其特征在于,所述联合攻击概率的表达式如下:攻击概率的表达式如下:其中,P(q)表示M个防御方飞行器对目标入侵方飞行器的联合攻击概率,且M个防御方飞行器包括第i个防御方飞行器;Q
k
表示第k个防御方飞行器的攻击范围;表示攻击半径上限值;Θ表示攻击水平角度上限值;Ψ表示攻击俯仰角度上限值;d
k
表示第k个防御方飞行器与目标入侵方飞行器的距离差;α
k
表示第k个防御方飞行器与目标入侵方飞行器的水平角度差;表示第k个防御方飞行器与目标入侵方飞行器的俯仰角度差。5.根据权利要求1所述的基于动态博弈的飞行器集群对抗方法,...

【专利技术属性】
技术研发人员:衣鹏金戈雷金龙洪奕光刘大卫王晓光张亚辉方红帏
申请(专利权)人:中国兵器科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1