一种基于深度随机博弈的空战机动策略生成技术制造技术

技术编号：26650852 阅读：22 留言：0更新日期：2020-12-09 00:51

本发明专利技术公开了一种基于深度随机博弈的近距空战机动策略生成技术，包括以下步骤：首先，依据1V1近距空战流程构建战机博弈对抗的训练环境，并设置敌方机动策略；其次，以随机博弈为标准，构建空战对抗双方的智能体，确定每个智能体的状态空间、动作空间和奖励函数；然后，使用随机博弈与深度强化学习相结合的极大极小值DQN算法构建神经网络，并训练我方智能体；最后，根据训练好的神经网络，通过线性规划方法得到空战态势下的最优机动策略，与敌方进行博弈对抗。本发明专利技术结合了随机博弈与深度强化学习的思想，提出了极大极小值DQN算法来获取一种最优的空战机动策略，可以应用于现有的空战机动引导系统中，能够实时准确地做出有效决策引导战机占据有利的态势位置。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度随机博弈的空战机动策略生成技术
本专利技术涉及空战博弈机动策略生成
，特别设计一种基于深度随机博弈的空战机动策略生成技术。
技术介绍
空中力量在现代战争中起着越来越重要的作用，制空权的争夺很大程度上决定了战争的胜负。然而空中作战形势瞬息万变，需要采集的信息极为复杂，使得作战方在感知空战态势后做出决策变得困难，传统方法无法实现一种快速准确的空战策略。本专利技术提出了一种基于深度随机博弈的空战机动策略生成技术，该方法结合了深度强化学习和随机博弈的思想，能够有效地针对空战对手的行动策略实时地选择有利于我方的机动动作并取得优势地位，对空战博弈对抗中制空权的争夺具有重要意义。
技术实现思路
本专利技术提供了一种基于深度随机博弈的空战机动策略生成技术，旨在感知空战态势后快速准确地获取一种能有效对抗对手的最优机动策略。实现本专利技术的技术方案为：一种基于深度随机博弈的空战机动策略生成技术，包括如下步骤：S1:根据飞机的运动学和动力学方程，构建双方战机的运动模型，结合空战规则，建立智能体的训练环境，并设置敌方机动策略；S2:构建基于随机博弈和深度强化学习的红蓝双方智能体，确定每个智能体的状态空间、动作空间和奖励函数；S3:使用随机博弈与深度强化学习相结合的极大极小值DQN算法构建神经网络，并训练红方智能体；S4:在空战博弈中，训练完成的红方智能体通过感知当前的空战态势，实时地生成最优机动策略，与蓝方进行博弈对抗，引导战机在空战中占据有利的态势位置。...

【技术保护点】
1.一种基于深度随机博弈的空战机动策略生成技术，其特征在于，包括以下步骤：/nS1:根据飞机的运动学和动力学方程，构建双方战机的运动模型，结合空战规则，建立智能体的训练环境，并设置敌方机动策略；/nS2:构建基于随机博弈和深度强化学习的红蓝双方智能体，确定每个智能体的状态空间、动作空间和奖励函数；/nS3:使用随机博弈与深度强化学习相结合的极大极小值DQN算法构建神经网络，并训练红方智能体；/nS4:在空战博弈中，训练完成的红方智能体通过感知当前的空战态势，实时地生成最优机动策略，与蓝方进行博弈对抗，引导战机在空战中占据有利的态势位置。/n

【技术特征摘要】
1.一种基于深度随机博弈的空战机动策略生成技术，其特征在于，包括以下步骤：
S1:根据飞机的运动学和动力学方程，构建双方战机的运动模型，结合空战规则，建立智能体的训练环境，并设置敌方机动策略；
S2:构建基于随机博弈和深度强化学习的红蓝双方智能体，确定每个智能体的状态空间、动作空间和奖励函数；
S3:使用随机博弈与深度强化学习相结合的极大极小值DQN算法构建神经网络，并训练红方智能体；
S4:在空战博弈中，训练完成的红方智能体通过感知当前的空战态势，实时地生成最优机动策略，与蓝方进行博弈对抗，引导战机在空战中占据有利的态势位置。

2.根据权利要求1所述的一种基于深度随机博弈的空战机动策略生成技术，其特征在于：步骤S3中，所述极大极小值DQN算法训练智能体的过程包括：
S301:利用DQN处理战机的连续无限状态空间，创建两个神经网络，分别为当前Q网络和目标Q网络，初始化当前Q网络参数为θ，目标Q网络参数为θ-＝θ。神经网络的输入为战机的状态特征，输出为该状态下所有红方可选动作a与蓝方可选动作o对应的状态动作值函数Q(s,a,o)；
S302:将智能体与环境交...

【专利技术属性】
技术研发人员：马文，王壮，吴昭欣，李辉，
申请(专利权)人：成都蓉奥科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人