【技术实现步骤摘要】
火力分配方法、装置、计算机设备、介质及程序产品
[0001]本公开涉及人工智能
,特别是涉及一种火力分配方法、装置、计算机设备、介质及程序产品。
技术介绍
[0002]协同作战作为现代战争的主要作战模式,需要根据作战任务合理地进行火力资源分配,研究复杂作战环境中的火力分配方法,对于提高多火力单元协同作战的整体效能有着重要的现实意义。火力分配问题是将m种弹药最优分配给n个目标,以使进攻成本最小化,该问题可被视为一个非线性整数规划问题。
[0003]为解决在大规模、信息不完全、多约束战场背景下,传统的火力分配算法无法在短时间内快速决策和动态响应的不足,基于学习的优化方法开始被应用于作战决策。基于学习的优化方法在训练集上学习到一个模型表征输入数据与解之间的映射关系,并利用离线训练在线测试的优势,使得训练好的模型可以在新的测试案例上快速给出火力分配方案。
[0004]相关技术中,应用强化学习方法求解的火力分配问题多集中于对单一火力攻击平台的资源分配,不涉及多火力攻击平台间的协同作战。协同作战作为典型的多智能体学习问题,需要对战场态势信息进行综合考虑而导致状态空间或动作空间巨大,直接应用强化学习求解将导致模型存在奖励稀疏、训练难收敛等问题。
技术实现思路
[0005]本公开提供了一种火力分配方法、装置、计算机设备、介质及程序产品。
[0006]根据本公开的一方面,提供了一种火力分配方法,包括:获取火力位置信息和第一火力资源信息,其中,所述火力位置信息指示多个攻击目标和多个攻击平台之 ...
【技术保护点】
【技术特征摘要】
1.一种火力分配方法,包括:获取火力位置信息和第一火力资源信息,其中,所述火力位置信息指示多个攻击目标和多个攻击平台之间的相对位置关系,所述多个攻击平台中的每个攻击平台包括多个火力单元,所述第一火力资源信息指示所述多个攻击平台中每个攻击平台包括的每个火力单元的弹药储备量和该火力单元针对所述多个攻击目标中的每个攻击目标的毁伤率;对于所述多个攻击目标中的每个攻击目标,执行处理步骤,所述处理步骤包括:利用强化学习算法模型处理所述火力位置信息和所述第一火力资源信息,以从所述多个攻击平台中确定用于打击该攻击目标的至少一个攻击平台;以及利用启发式算法模型处理所述第一火力资源信息中与所述至少一个攻击平台关联的第二火力资源信息,得到针对该攻击目标的第一火力分配方案;根据针对所述多个攻击目标的相应多个第一火力分配方案确定所述多个攻击目标中每个攻击目标的毁伤率;响应于确定所述多个攻击目标中的至少一个攻击目标的毁伤率小于第一阈值,根据所述多个第一火力分配方案确定所述多个攻击平台中每个攻击平台的每个火力单元的弹药消耗量以更新所述第一火力资源信息,并基于更新后的第一火力资源信息针对所述多个攻击目标中的每个攻击目标重新执行所述处理步骤;以及响应于确定所述多个攻击目标的毁伤率均不小于所述第一阈值,根据所述多个第一火力分配方案生成目标火力分配方案。2.根据权利要求1所述的方法,还包括,在所述基于更新后的第一火力资源信息针对所述多个攻击目标中的每个攻击目标重新执行所述处理步骤之前:根据所述多个第一火力分配方案确定当前所述多个第一攻击平台消耗的弹药总量;将所述弹药总量作为奖励返回所述强化学习算法模型,以调整所述强化学习算法模型的网络参数。3.根据权利要求1所述的方法,其中,所述启发式算法模型包括基于贪婪准则的贪心算法模型,所述利用启发式算法模型处理所述第一火力资源信息中与所述至少一个攻击平台关联的第二火力资源信息,包括:基于所述第二火力资源信息生成用于所述贪心算法模型的第一元素序列,所述第一元素序列中的元素与所述至少一个攻击平台包括的火力单元一一对应;基于所述第一元素序列构造初始解;删除所述初始解中的至少一个元素,得到第一不可行解;从所述第一元素序列中选择至少一个元素加入所述第一不可行解,得到第一可行解;确定基于所述第一不可行解生成的第二火力分配方案所消耗的第一弹药量和基于所述第一可行解生成的第三火力分配方案所消耗的第二弹药量;响应于所述第二弹药量小于所述第一弹药量且当前迭代次数小于第二阈值,将所述初始解更新为所述第一可行解,并基于更新后的初始解重复所述删除所述初始解中的至少一个元素,得到第一不可行解的步骤;响应于所述第二弹药量小于所述第一弹药量且当前迭代次数不小于所述第二阈值,将所述第三火力分配方案作为针对该攻击目标的第一火力分配方案;响应于所述第二弹药量不小于所述第一弹药量且当前迭代次数小于所述第二阈值,重
复所述删除所述初始解中的至少一个元素,得到第一不可行解的步骤;以及响应于所述第二弹药量不小于所述第一弹药量且当前迭代次数不小于所述第二阈值,将所述第二火力分配方案作为针对该攻击目标的第一火力分配方案。4.根据权利要求1所述的方法,其中,所述启发式算法模型包括基于种群进化的遗传算法模型,所述利用启发式算法模型处理所述第一火力资源信息中与所述至少一个攻击平台关联的第二火力资源信息,包括:基于所述第二火力资源信息生成用于所述遗传算法模型的第二元素序列,所述第二元素序列中的元素与所述至少一个攻击平台包括的火力单元一一对应;基于所述第二元素序列,构造多个初始解加入初始解集;计算所述初始解集中的每个初始解的适应度,得到多个适应度;响应于所述多个适应度中最大的适应度大于第三阈值,基于所述最大的适应度对应的初始解生成针对该攻击目标的第一火力分配方案;响应于所述多个适应度中最...
【专利技术属性】
技术研发人员:叶丰,林金,王彬彬,申之明,
申请(专利权)人:军事科学院系统工程研究院系统总体研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。