一种基于红蓝博弈对抗的电磁行动策略生成方法和系统技术方案

技术编号:40596962 阅读:30 留言:0更新日期:2024-03-12 21:59
本发明专利技术提供一种基于红蓝博弈对抗的电磁行动策略生成方法及系统,所述方法包括:获取电磁行动的行动集合,基于所述行动集合构建博弈树模型;所述行动集合包括多组行动,每组行动对应一个行动序列和一个策略;所述行动序列为红方或蓝方在不同时刻采用不同行动的行动顺序;获取对方的行动信息,将所述行动信息映射到所述博弈树模型中,得到至少一个策略;基于得到的策略,计算得到每个行动的第一概率和每个策略的第二概率,并计算得到行动收益和后悔值;基于所述行动收益和所述后悔值,得到最终电磁行动策略。本发明专利技术在红蓝双方对弈的同时,可以迅速做出应对,输出相应的行动策略,在一定程度上提高获胜概率。

【技术实现步骤摘要】

本专利技术涉及仿真与智能对抗,尤其涉及一种基于红蓝博弈对抗的非完备信息的电磁行动策略生成方法和系统。


技术介绍

1、红蓝双方在进行博弈对抗时,随着态势的不断推进,双方的决策会不断更新,也会持续将对方的决策纳入到己方的决策考虑中,并以迭代的思想反复更新行动策略,这样才能在博弈对抗中掌握主动权。而随着设备越来越先进,博弈场上的态势变化也越来越迅速,红蓝双方在进行博弈对抗时预测对方的对抗策略也变得越来越困难。

2、非完备信息机器博弈是指智能体无法通过任何手段获取全部的博弈状态和信息,存在隐藏信息和信息不对称的特点。和完备信息博弈相比,非完备信息博弈更加贴近电磁行动。

3、机器博弈如果要顺利完成任务,就需要在复杂未知场景下根据已经掌握的信息,尽可能迅速分析得到科学和最优的对抗策略;然而,对于任务复杂、维度较大的红蓝电磁行动而言,还缺少切实有效的解决方法。


技术实现思路

1、本专利技术提供一种基于红蓝博弈对抗的电磁行动策略生成方法和系统,用以解决现有技术中无法在复杂场景下迅速分析得到最优对抗策略本文档来自技高网...

【技术保护点】

1.一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述后悔值的得到还包括:

3.如权利要求2所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,当所述红蓝博弈对抗为多个回合时,所述后悔值的得到还包括:获得每个回合的后悔值,得到多个后悔值并求取多个后悔值的平均后悔值。

4.如权利要求1所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述行动收益ui(σ,h)的计算方式为:

5.如权利要求3所述的一种基于红蓝博弈对抗的...

【技术特征摘要】

1.一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述后悔值的得到还包括:

3.如权利要求2所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,当所述红蓝博弈对抗为多个回合时,所述后悔值的得到还包括:获得每个回合的后悔值,得到多个后悔值并求取多个后悔值的平均后悔值。

4.如权利要求1所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述行动收益ui(σ,h)的计算方式为:

5.如权利要求3所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,基于对方的行动信息,红方或蓝方在第t回合采取行动a的所述后悔值的计算方式为:

6.如权利要求5所述的一种基于红蓝博弈对抗的电磁行动策略生成...

【专利技术属性】
技术研发人员:康国钦刘汉戴峥宋伟赵志远邹晓鋆许旭光
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1