【技术实现步骤摘要】
海空集群对抗的推演仿真系统及方法、设备、存储介质
[0001]本专利技术涉及兵棋推演仿真
,特别地,涉及一种海空集群对抗的推演仿真系统及方法、设备、计算机可读取的存储介质。
技术介绍
[0002]海空集群对抗的决策控制是兵棋推演仿真研究领域的一个重要研究方向,是跨域跨平台群体作战单元完成作战任务目标的关键技术,而应用深度强化学习技术来解决海空集群对抗的决策控制问题是一种有效的方法。但是,目前针对海空集群对抗的深度强化学习算法,首先需要研究平台生成大量的样本数据用于算法训练,如果直接使用海空实际装备进行大量演习实验来获取这些数据,不仅耗费巨大,效率低,而且风险极高;其次,需要研究平台能够合理评估算法性能,指导算法的演化改进,迭代持续提升算法性能直至收敛。因此,如何为深度强化学习技术提供大量样本数据以便于进行算法训练以及训练完成后如何对算法性能进行评价成为了海空集群对抗推演仿真技术亟待解决的关键问题。
技术实现思路
[0003]本专利技术提供了一种海空集群对抗的推演仿真系统及方法、设备、计算机可读取的存储介 ...
【技术保护点】
【技术特征摘要】
1.一种海空集群对抗的推演仿真系统,其特征在于,包括仿真系统和深度强化学习系统,所述仿真系统部署在多台计算节点上,所述深度强化学习系统部署在一台服务器上,多台计算节点与服务器通过网络连接,每台计算节点的仿真系统中运行多个仿真系统实例;所述仿真系统包括用于设置作战对抗初始状态和作战任务的想定模块,用于生成海空集群交战的战场环境模型的海空环境设定模块,用于生成海空集群交战的海空装备模型的海空装备设定模块,用于对海空装备模型的交火行为进行裁决、给出海空装备模型的受损信息并更新其状态的交战裁决模块,以及用于与深度强化学习系统进行信息交互的外部访问接口;所述深度强化学习系统包括深度强化学习算法模块和接口封装模块,所述深度强化学习算法模块用于通过所述仿真系统的外部访问接口控制多个仿真系统实例的运行、读取每个仿真系统实例的战场态势信息,基于读取的战场态势信息对神经网络模型进行训练,并利用神经网络模型输出每个仿真系统实例的海空集群联合动作,所述接口封装模块用于将神经网络模型输出的海空集群联合动作转换为仿真系统实例的作战命令,并通过调用外部访问接口将作战命令传输至对应的仿真系统,所述仿真系统根据接收的作战命令对运行的多个仿真系统实例进行控制并更新状态。2.如权利要求1所述的海空集群对抗的推演仿真系统,其特征在于,所述仿真系统采用定步长的时间推进方式,在每个步长,所述深度强化学习系统通过仿真系统的外部访问接口控制仿真系统实例运行、获取战场态势信息和下发任务命令。3.如权利要求1所述的海空集群对抗的推演仿真系统,其特征在于,所述想定模块设置作战对抗初始状态和作战任务的过程为:新建想定,输入想定名称;输入想定基本信息,包括想定推演方及其敌对关系、作战仿真开始/结束时间、想定描述,推演双方中的一方由所述深度强化学习算法模块进行控制,另一方由预先制定的作战规划或预设算法进行控制;设置作战区域;部署作战兵力;设置条令规则,包括兵力和武器装备的交战规则;设计由非深度强化学习算法控制的推演方的作战任务;保存想定。4.如权利要求1所述的海空集群对抗的推演仿真系统,其特征在于,所述海空装备设定模块包括机动模型设定单元、侦查模型设定单元、火力模型设定单元和任务处理单元,所述机动模型设定单元用于设定海空装备模型的机动能力,所述侦查模型设定单元用于设定海空装备模型的侦查能力,所述火力模型设定单元用于设定海空装备模型的作战武器,所述任务处理单元用于基于所述机动模型设定单元、侦查模型设定单元、火力模型设定单元的设定信息生成海空装备模型。5.如权利要求1所述的海空集群对抗的推演仿真系统,其特征在于,所述交战裁决模块对海空装备模型的交火行为进行裁决、给出海空装备模型的受损信息并更新其状态的过程具体为:加载作战武器信息、目标信息、环境信息、武器到目标的距离信息;
基于加载...
【专利技术属性】
技术研发人员:刘宝宏,
申请(专利权)人:湖南苍树航天科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。