火力分配方法、装置、计算机设备、介质及程序产品制造方法及图纸

技术编号:38520275 阅读:18 留言:0更新日期:2023-08-19 17:00
提供了一种火力分配方法,包括:获取火力位置信息和第一火力资源信息;对于多个攻击目标中的每个攻击目标,利用强化学习算法模型处理火力位置信息和第一火力资源信息,以确定用于打击该攻击目标的至少一个攻击平台,利用启发式算法模型处理与至少一个攻击平台关联的第二火力资源信息,得到针对该攻击目标的第一火力分配方案;根据多个第一火力分配方案确定每个攻击目标的毁伤率;响应于确定至少一个攻击目标的毁伤率小于第一阈值,确定每个火力单元的弹药消耗量以更新第一火力资源信息,并重新执行利用强化学习算法模型处理火力位置信息和第一火力资源信息的步骤;以及响应于确定多个攻击目标的毁伤率均不小于第一阈值,生成目标火力分配方案。目标火力分配方案。目标火力分配方案。

【技术实现步骤摘要】
火力分配方法、装置、计算机设备、介质及程序产品


[0001]本公开涉及人工智能
,特别是涉及一种火力分配方法、装置、计算机设备、介质及程序产品。

技术介绍

[0002]协同作战作为现代战争的主要作战模式,需要根据作战任务合理地进行火力资源分配,研究复杂作战环境中的火力分配方法,对于提高多火力单元协同作战的整体效能有着重要的现实意义。火力分配问题是将m种弹药最优分配给n个目标,以使进攻成本最小化,该问题可被视为一个非线性整数规划问题。
[0003]为解决在大规模、信息不完全、多约束战场背景下,传统的火力分配算法无法在短时间内快速决策和动态响应的不足,基于学习的优化方法开始被应用于作战决策。基于学习的优化方法在训练集上学习到一个模型表征输入数据与解之间的映射关系,并利用离线训练在线测试的优势,使得训练好的模型可以在新的测试案例上快速给出火力分配方案。
[0004]相关技术中,应用强化学习方法求解的火力分配问题多集中于对单一火力攻击平台的资源分配,不涉及多火力攻击平台间的协同作战。协同作战作为典型的多智能体学习问题,需要对战场态势信息进行综合考虑而导致状态空间或动作空间巨大,直接应用强化学习求解将导致模型存在奖励稀疏、训练难收敛等问题。

技术实现思路

[0005]本公开提供了一种火力分配方法、装置、计算机设备、介质及程序产品。
[0006]根据本公开的一方面,提供了一种火力分配方法,包括:获取火力位置信息和第一火力资源信息,其中,所述火力位置信息指示多个攻击目标和多个攻击平台之间的相对位置关系,所述多个攻击平台中的每个攻击平台包括多个火力单元,所述第一火力资源信息指示所述多个攻击平台中每个攻击平台包括的每个火力单元的弹药储备量和该火力单元针对所述多个攻击目标中的每个攻击目标的毁伤率;对于所述多个攻击目标中的每个攻击目标,执行处理步骤,所述处理步骤包括:利用强化学习算法模型处理所述火力位置信息和所述第一火力资源信息,以从所述多个攻击平台中确定用于打击该攻击目标的至少一个攻击平台;利用启发式算法模型处理所述第一火力资源信息中与所述至少一个攻击平台关联的第二火力资源信息,得到针对该攻击目标的第一火力分配方案;根据针对所述多个攻击目标的相应多个第一火力分配方案确定所述多个攻击目标中每个攻击目标的毁伤率;响应于确定所述多个攻击目标中的至少一个攻击目标的毁伤率小于第一阈值,根据所述多个第一火力分配方案确定所述多个攻击平台中每个攻击平台的每个火力单元的弹药消耗量以更新所述第一火力资源信息,并基于更新后的第一火力资源信息针对所述多个攻击目标中的每个攻击目标重新执行所述处理步骤;以及响应于确定所述多个攻击目标的毁伤率均不小于所述第一阈值,根据所述多个第一火力分配方案生成目标火力分配方案。
[0007]根据本公开的另一方面,提供了一种火力分配装置,包括:信息获取单元,用于获
取火力位置信息和第一火力资源信息,其中,所述火力位置信息指示多个攻击目标和多个攻击平台之间的相对位置关系,所述多个攻击平台中的每个攻击平台包括多个火力单元,所述第一火力资源信息指示每个攻击平台包括的每个火力单元的弹药储备量和该火力单元针对所述多个攻击目标中的每个攻击目标的毁伤率;信息处理单元,用于对于所述多个攻击目标中的每个攻击目标,执行处理步骤,所述处理步骤包括:利用强化学习算法模型处理所述火力位置信息和所述第一火力资源信息,以从所述多个攻击平台中确定用于打击该攻击目标的至少一个攻击平台;利用启发式算法模型处理所述第一火力资源信息中与所述至少一个攻击平台关联的第二火力资源信息,得到针对该攻击目标的第一火力分配方案;毁伤率确定单元,用于根据针对所述多个攻击目标的相应多个第一火力分配方案确定所述多个攻击目标中每个攻击目标的毁伤率;信息更新单元,用于响应于确定所述多个攻击目标中的至少一个攻击目标的毁伤率小于第一阈值,根据所述多个第一火力分配方案确定所述多个攻击平台中每个攻击平台的每个火力单元的弹药消耗量以更新所述第一火力资源信息,并基于更新后的第一火力资源信息针对所述多个攻击目标中的每个攻击目标重新执行所述处理步骤;以及方案确定单元,用于响应于确定所述多个攻击目标的毁伤率均不小于所述第一阈值,根据所述多个第一火力分配方案生成目标火力分配方案。
[0008]根据本公开的另一方面,提供了一种计算机设备,包括:至少一个处理器;以及存储器,其上存储有计算机程序,其中,计算机程序在被处理器执行时,使处理器执行上述的方法。
[0009]根据本公开的又另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,使处理器执行上述的方法。
[0010]根据本公开的再另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,使处理器执行上述的方法。
[0011]根据本公开的一个或多个实施例,对于多平台协同作战场景,先使用强化学习算法模型确定每个攻击目标对应的攻击平台序列,再利用启发式算法模型确定针对每个攻击目标的最优火力分配方案,改善了传统启发式方法求解时间消耗长的弊端,有效增强了强化学习模型的稳定性并加快其收敛速度,实现了能够针对多攻击目标和多攻击平台的作战场景高效准确地确定出最优火力分配方案。
[0012]根据在下文中所描述的实施例,本公开的这些和其它方面将是清楚明白的,并且将参考在下文中所描述的实施例而被阐明。
附图说明
[0013]在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:
[0014]图1是图示出根据示例性实施例的可以在其中实施本文描述的各种方法的示例系统的示意图;
[0015]图2是图示出根据示例性实施例的火力分配方法的流程图;
[0016]图3是图示出根据示例性实施例的使用基于贪婪准则的贪心算法处理第二火力资源信息的流程图;
[0017]图4是图示出根据示例性实施例的使用基于单点随机搜索的邻域搜索算法模型处
理第二火力资源信息的流程图;
[0018]图5是图示出根据示例性实施例的使用基于种群进化的遗传算法模型处理第二火力资源信息的流程图;
[0019]图6是图示出根据另一种示例性实施例的火力分配方法的部分流程示意图;
[0020]图7是图示出根据示例性实施例的火力分配装置的示意性框图;
[0021]图8是图示出能够应用于示例性实施例的示例性计算机设备的框图。
具体实施方式
[0022]在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
[0023]在本公开中对各种示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种火力分配方法,包括:获取火力位置信息和第一火力资源信息,其中,所述火力位置信息指示多个攻击目标和多个攻击平台之间的相对位置关系,所述多个攻击平台中的每个攻击平台包括多个火力单元,所述第一火力资源信息指示所述多个攻击平台中每个攻击平台包括的每个火力单元的弹药储备量和该火力单元针对所述多个攻击目标中的每个攻击目标的毁伤率;对于所述多个攻击目标中的每个攻击目标,执行处理步骤,所述处理步骤包括:利用强化学习算法模型处理所述火力位置信息和所述第一火力资源信息,以从所述多个攻击平台中确定用于打击该攻击目标的至少一个攻击平台;以及利用启发式算法模型处理所述第一火力资源信息中与所述至少一个攻击平台关联的第二火力资源信息,得到针对该攻击目标的第一火力分配方案;根据针对所述多个攻击目标的相应多个第一火力分配方案确定所述多个攻击目标中每个攻击目标的毁伤率;响应于确定所述多个攻击目标中的至少一个攻击目标的毁伤率小于第一阈值,根据所述多个第一火力分配方案确定所述多个攻击平台中每个攻击平台的每个火力单元的弹药消耗量以更新所述第一火力资源信息,并基于更新后的第一火力资源信息针对所述多个攻击目标中的每个攻击目标重新执行所述处理步骤;以及响应于确定所述多个攻击目标的毁伤率均不小于所述第一阈值,根据所述多个第一火力分配方案生成目标火力分配方案。2.根据权利要求1所述的方法,还包括,在所述基于更新后的第一火力资源信息针对所述多个攻击目标中的每个攻击目标重新执行所述处理步骤之前:根据所述多个第一火力分配方案确定当前所述多个第一攻击平台消耗的弹药总量;将所述弹药总量作为奖励返回所述强化学习算法模型,以调整所述强化学习算法模型的网络参数。3.根据权利要求1所述的方法,其中,所述启发式算法模型包括基于贪婪准则的贪心算法模型,所述利用启发式算法模型处理所述第一火力资源信息中与所述至少一个攻击平台关联的第二火力资源信息,包括:基于所述第二火力资源信息生成用于所述贪心算法模型的第一元素序列,所述第一元素序列中的元素与所述至少一个攻击平台包括的火力单元一一对应;基于所述第一元素序列构造初始解;删除所述初始解中的至少一个元素,得到第一不可行解;从所述第一元素序列中选择至少一个元素加入所述第一不可行解,得到第一可行解;确定基于所述第一不可行解生成的第二火力分配方案所消耗的第一弹药量和基于所述第一可行解生成的第三火力分配方案所消耗的第二弹药量;响应于所述第二弹药量小于所述第一弹药量且当前迭代次数小于第二阈值,将所述初始解更新为所述第一可行解,并基于更新后的初始解重复所述删除所述初始解中的至少一个元素,得到第一不可行解的步骤;响应于所述第二弹药量小于所述第一弹药量且当前迭代次数不小于所述第二阈值,将所述第三火力分配方案作为针对该攻击目标的第一火力分配方案;响应于所述第二弹药量不小于所述第一弹药量且当前迭代次数小于所述第二阈值,重
复所述删除所述初始解中的至少一个元素,得到第一不可行解的步骤;以及响应于所述第二弹药量不小于所述第一弹药量且当前迭代次数不小于所述第二阈值,将所述第二火力分配方案作为针对该攻击目标的第一火力分配方案。4.根据权利要求1所述的方法,其中,所述启发式算法模型包括基于种群进化的遗传算法模型,所述利用启发式算法模型处理所述第一火力资源信息中与所述至少一个攻击平台关联的第二火力资源信息,包括:基于所述第二火力资源信息生成用于所述遗传算法模型的第二元素序列,所述第二元素序列中的元素与所述至少一个攻击平台包括的火力单元一一对应;基于所述第二元素序列,构造多个初始解加入初始解集;计算所述初始解集中的每个初始解的适应度,得到多个适应度;响应于所述多个适应度中最大的适应度大于第三阈值,基于所述最大的适应度对应的初始解生成针对该攻击目标的第一火力分配方案;响应于所述多个适应度中最...

【专利技术属性】
技术研发人员:叶丰林金王彬彬申之明
申请(专利权)人:军事科学院系统工程研究院系统总体研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1