System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及基于一种基于人工智能与人员的协同对抗决策方法、装置及存储介质,属于人工智能。
技术介绍
1、军事策略推演仿真是一种重要的军事训练和决策支持手段,可以帮助军事人员更好地理解和应对复杂多变的战场环境。随着技术的不断进步,推演仿真方法也将不断完善和优化,为军事决策提供更加强大和有效的支持。
2、传统的军事策略推演仿真只能基于人工策略和想定的推演进行仿真,因此很消耗人力,随着人工智能日益成熟,目前的仿真装置逐渐转变为对大量人力和高耗时的相关研究,以提高军事智能研究的综合效益。然而,推演仿真虽可以模拟战场环境和作战行动,但它无法完全模拟人的决策过程和心理因素。在真实战场上,指挥官的决策往往受到多种因素的影响,如情绪、经验、直觉等,而这些因素在推演仿真中难以准确模拟。
3、因此,亟待提供一种结合人工智能与人员的协同对抗决策方法以解决现有军事策略仿真中所面临的技术弊端。
技术实现思路
1、本专利技术的目的在于提供一种基于人工智能与人员的协同对抗决策方法、装置及存储介质,旨在将人工智能决策的客观高效与人员决策的主观能动性进行结合,以提高决策的全面性以及准确性。
2、为解决上述技术问题,本专利技术是采用下述技术方案实现的:
3、一方面,本专利技术提供了一种协同对抗决策方法,其包括:
4、通过对环境想定设定、前期筹划设定及态势想定设定,并生成相应的基础场景想定;
5、根据所述基础场景想定生成行为策略,所述行为策略包括
6、将所述基础场景想定及所述行为策略输入至智能对抗推演引擎中进行仿真推演,得到仿真推演结果;
7、对所述仿真推演结果进行打分,得到基于所述基础场景想定及所述行为策略的仿真结果得分;
8、将仿真结果得分、行为策略以及基础场景想定输入至人工智能决策模型,所述人工智能决策模型基于所述仿真结果得分,通过调整策略选取因子,直至输出预设目标得分下相对应的航路航线、队形编队及波次;
9、其中,所述人员发挥主观能动性,对所述第一行为策略做出主观判断。
10、现有技术中的大数据学习,大都需要大量的人工样本进行学习,本专利技术通过对大样本数据的自产自销,将仿真决策结果反馈式输入人工智能决策模型,实现了深度学习样本的自动生成以及结果打分可重复自动化应用;其次,原有的大样本学习,还需要经过专业的调试及复杂分析,效率较为低下,本专利技术创新式的将人员主观判断引入决策的最终确定环节,使得智能体能够在人员验证的双重保证下,自动录入大数据进行样本学习,实现了行为策略生成的高效率及最优化,目的性强。
11、可选的,所述前期筹划设定包括装备选择、载荷筹划及行动能力确定。
12、可选的,所述第一行为策略,基于所述基础场景想定并经大样本深度学习,生成人工智能模型对应的决策;
13、所述第二行为策略,通过对所述基础场景想定中的装备进行队形编队,并基于所述基础场景想定中的态势想定及环境想定进行航路航线规划,并设定时间策略对应的波束及波次,生成人员对应的决策。
14、可选的,所述仿真推演包括物理仿真及损伤威力仿真。
15、可选的,所述行为策略包括:资源池、属方关系及编队池。
16、其中,所述资源池包括:属方、实体单元的大类及名称、实体单元总数量以及已分配的实体单元数量;
17、所述属方关系包括:红与蓝双方、红与不明双方以及蓝与不明双方;
18、所述编队池包括:属方主站法、属方使用战法、属方目标名称、属方成败条件、任务类型、任务目标名称、任务是否为区域、任务是否主要、任务区域最小高度、任务区域最大高度、任务成败条件、任务区域点集、任务的领取编队、编队名称、编队控制方、编队智能算法、编队的成员类型、编队的波次时间、编队的被挂载单元、编队的中心位置、编队的任务、实体单元的仿真名称、实体单元的大类、实体单元的名称、实体单元的类型、实体单元的携带编队、实体单元的组件、实体单元的组件、实体单元的位置、实体单元的姿态、实体单元的行为、实体单元的载荷、航点数据、航点名称、航点类型、航点位置、航点速度、航点待机时间、航点攻击模式、航点攻击目标、航点雷达是否打开、航点干扰器是否打开、航点干扰对象以及航点队形偏移数据。
19、可选的,所述仿真结果包括:按势力统计的仿真结果,以及按分组统计的仿真结果。
20、其中,按势力统计的仿真结果包括:兵力数量、损失兵力、损失弹药、损失比、仿真持续时间、属方使用的战法及仿真结果得分;
21、按分组统计的仿真结果包括:一行编队数据、编队名称、兵力类型、编队下作战单元的数量、编队的控制方、存活情况及任务目标。
22、可选的,所述人工智能决策模型的损失函数,表示为:
23、
24、式中,式中,l(θ)表示损失函数,n表示训练样本的数量,θ表示模型的参数,xi表示输入向量,ti表示目标输出向量。
25、可选的,采用梯度下降方法更新所述人工智能决策模型的参数,表示为:
26、
27、式中,η表示学习率,表示损失函数l(θ)关于θ的梯度。
28、可选的,所述仿真结果得分,表示为:
29、
30、式中,sc表示红方的仿真结果得分,a表示蓝方存活数量比,b表示红方的存活数量比,p表示交战时间消耗。
31、其中,所述蓝方存活数量比及红方的存活数量比,分别表示为:
32、a=c/(c+d)
33、b=e/(e+f)
34、式中,c表示蓝方推演结束时的存活数量,d表示蓝方推演结束时的死亡数量;e表示红方推演结束时的存活数量,f表示红方推演结束时的死亡数量。
35、值得说明的是,红方代表策略方,蓝方则相对应的代表敌方。
36、第二方面,本专利技术提供一种协同对抗决策装置,其包括:
37、基础场景想定模块,被配置用于,通过对环境想定设定、前期筹划设定及态势想定设定,并生成基础场景想定;
38、行为策略产生模块,被配置用于,根据所述基础场景想定生成行为策略,所述行为策略包括基于人工智能决策模型的第一行为策略与基于人员的第二行为策略;
39、推演执行模块,被配置用于,将所述基础场景想定及所述行为策略输入至智能对抗推演引擎中进行仿真推演,得到仿真推演结果;
40、执行结果解析模块,被配置用于,对所述仿真推演结果进行打分,得到基于所述基础场景想定及所述行为策略的仿真结果得分;
41、以及,最终决策确定模块,被配置用于,将仿真结果得分、行为策略以及基础场景想定输入至人工智能决策模型,所述人工智能决策模型基于所述仿真结果得分,通过调整策略选取因子,直至输出预设目标得分下相对应的航路航线、队形编队及波次;
42、其中,所述人员发挥主观本文档来自技高网...
【技术保护点】
1.一种协同对抗决策方法,其特征在于,包括:
2.根据权利要求1所述的协同对抗决策方法,其特征在于,所述前期筹划设定包括装备选择、载荷筹划及行动能力确定。
3.根据权利要求2所述的协同对抗决策方法,其特征在于,所述第一行为策略,基于所述基础场景想定并经大样本深度学习,生成人工智能模型对应的决策;
4.根据权利要求3所述的协同对抗决策方法,其特征在于,所述仿真推演包括物理仿真及损伤威力仿真。
5.根据权利要求4所述的协同对抗决策方法,其特征在于,所述行为策略包括:资源池、属方关系及编队池。
6.根据权利要求5所述的协同对抗决策方法,其特征在于,所述人工智能决策模型的损失函数,表示为:
7.根据权利要求6所述的协同对抗决策方法,其特征在于,采用梯度下降方法更新所述人工智能决策模型的参数,表示为:
8.根据权利要求1或7所述的协同对抗决策方法,其特征在于,所述仿真结果得分,表示为:
9.一种协同对抗决策装置,其包括:
10.一种计算机可读存储介质,其上存储有计算机程序,该计算机程
...【技术特征摘要】
1.一种协同对抗决策方法,其特征在于,包括:
2.根据权利要求1所述的协同对抗决策方法,其特征在于,所述前期筹划设定包括装备选择、载荷筹划及行动能力确定。
3.根据权利要求2所述的协同对抗决策方法,其特征在于,所述第一行为策略,基于所述基础场景想定并经大样本深度学习,生成人工智能模型对应的决策;
4.根据权利要求3所述的协同对抗决策方法,其特征在于,所述仿真推演包括物理仿真及损伤威力仿真。
5.根据权利要求4所述的协同对抗决策方法,其特征在于,所述行为策略包括:资源池、属方关系及编...
【专利技术属性】
技术研发人员:张勇超,王帅辉,聂海英,李魁彬,左登云,尚佳,文俭,刘楚墙,
申请(专利权)人:中国人民解放军海军指挥学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。