【技术实现步骤摘要】
本专利技术涉及仿真与智能对抗,尤其涉及一种基于红蓝博弈对抗的非完备信息的电磁行动策略生成方法和系统。
技术介绍
1、红蓝双方在进行博弈对抗时,随着态势的不断推进,双方的决策会不断更新,也会持续将对方的决策纳入到己方的决策考虑中,并以迭代的思想反复更新行动策略,这样才能在博弈对抗中掌握主动权。而随着设备越来越先进,博弈场上的态势变化也越来越迅速,红蓝双方在进行博弈对抗时预测对方的对抗策略也变得越来越困难。
2、非完备信息机器博弈是指智能体无法通过任何手段获取全部的博弈状态和信息,存在隐藏信息和信息不对称的特点。和完备信息博弈相比,非完备信息博弈更加贴近电磁行动。
3、机器博弈如果要顺利完成任务,就需要在复杂未知场景下根据已经掌握的信息,尽可能迅速分析得到科学和最优的对抗策略;然而,对于任务复杂、维度较大的红蓝电磁行动而言,还缺少切实有效的解决方法。
技术实现思路
1、本专利技术提供一种基于红蓝博弈对抗的电磁行动策略生成方法和系统,用以解决现有技术中无法在复杂场景下迅速 ...
【技术保护点】
1.一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述后悔值的得到还包括:
3.如权利要求2所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,当所述红蓝博弈对抗为多个回合时,所述后悔值的得到还包括:获得每个回合的后悔值,得到多个后悔值并求取多个后悔值的平均后悔值。
4.如权利要求1所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述行动收益ui(σ,h)的计算方式为:
5.如权利要求3所述的一
...【技术特征摘要】
1.一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述后悔值的得到还包括:
3.如权利要求2所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,当所述红蓝博弈对抗为多个回合时,所述后悔值的得到还包括:获得每个回合的后悔值,得到多个后悔值并求取多个后悔值的平均后悔值。
4.如权利要求1所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,所述行动收益ui(σ,h)的计算方式为:
5.如权利要求3所述的一种基于红蓝博弈对抗的电磁行动策略生成方法,其特征在于,基于对方的行动信息,红方或蓝方在第t回合采取行动a的所述后悔值的计算方式为:
6.如权利要求5所述的一种基于红蓝博弈对抗的电磁行动策略生成...
【专利技术属性】
技术研发人员:康国钦,刘汉,戴峥,宋伟,赵志远,邹晓鋆,许旭光,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。