【技术实现步骤摘要】
一种基于离散空间的对抗性群集体系的阵型模拟优化系统
[0001]本专利技术涉及群集体系,复杂网络,对抗性博弈领域,主要涉及一种基于离散空间的对抗性群集体系的阵型模拟优化系统。
技术介绍
[0002]军事作战讲究阵型,一个优秀的阵型可以最大限度地发挥所有战争单位的火力,用更短的时间向敌人投射更多的弹药,对赢取战斗有决定意义。
[0003]在常见的军事战术中,尤其以海军、空军的作战单位(包括水面舰艇、潜艇、航空母舰、战斗机、海空侦察机等兵种)在实战场景下,经常会面临由于战场可见度、科技水平、敌友力量对比等因素的限制,而需要采取“机动灵活,围点打援,创造局部作战数量优势”的策略,20世纪初法国军队中的绿水学派针对这一问题,提出了一种新的海军作战思想,即主张以潜艇、战斗机、鱼雷艇等建造成本较低但数量庞大的作战单位对抗由少量大战舰组成的海军舰队,在局部地区创造“敌寡我众”的场景并围而歼之。
[0004]因此,如何创造局部优势成为了军事研究的重要课题,在目前的军事战术研究中,有很多不同类型对抗性群集体系阵型博弈策略可以实现这一优势,另外,对这方面的研究也进入到一个逐渐广泛化的阶段,尤其是关于对抗性集体系阵型博弈阵型的研究在上个世纪的海军战术分析中普及开来后,在空军、陆军乃至各个行业、各个领域的博弈课题中,也都出现了广泛地研究和仿真模拟,不同领域的科学家和工程师们试图通过模拟不同的博弈阵型变换,从而获得更加优秀的博弈策略和系统。典型的对抗性群集体系的阵型有“T字阵型”策略,该策略主要来自于法国海军绿水学派于第一次世 ...
【技术保护点】
【技术特征摘要】
1.一种基于离散空间的对抗性群集体系的阵型模拟优化系统,其特征在于,包括以下模块:规则定义模块,初始化模块,博弈树算法模块,静态评估函数模块,胜负判定模块,显示界面及运行模块,数据库模块;所述的规则定义模块:根据用户需求,自定义各个博弈成员的获胜行为,确保静态评估函数模块能够正确合理打分;所述的初始化模块:生成棋盘网格、成员数量及位置,创建数据库表,为接下来显示界面及运行模块和数据库模块正常运行做准备;所述的博弈树算法模块:为两队成员能够进行博弈提供算法框架;所述的静态评估函数模块:系统运行过程中,博弈成员通过该模块为自己接下来的所有走法进行打分,并选取分值最大的走法作为接下来的路径;所述的胜负判定模块:对每一局的局面进行判定,判断当前局面是否满足规则定义模块里定义的规则,若不满足则继续博弈,若满足某个规则则输出胜/负/平结果;所述的显示界面及运行模块:为博弈系统提供可视化界面,使用户能够直观的看到博弈的正过程;所述的数据库模块:存取博弈成员的路径数据和胜负数据。2.根据权利要求1所述的一种基于离散空间的对抗性群集体系的阵型模拟优化系统,其特征在于,所述的规则定义模块具体如下:定义博弈规则,该博弈策略空间模拟系统可定义如下博弈规则:博弈队伍数量为双队博弈,每支队伍队内成员为N人,N为需要输入的数值,根据需求为每支队伍成员数量赋值,博弈判定方式为摆出形状并吃掉对手成员,博弈胜负表示为胜、负、平;博弈判定方式的公式如下,n为其中一个队伍的人数递增序列,hit(X,Y)为一个成员打击范围的坐标值,公式如下:定义离散化网格棋盘;由于在现实博弈过程中成员的坐标是连续性的,为方便和简化场景,因此在这里通过四舍五入方式将连续坐标转化为离散状态,通过近似值法将非整数部分抹去,转换公式如下:其中为x的近似值;设置网格棋盘坐标为离散态,棋盘大小为board_n*board_n,board_n是需要输入进系统的值,棋盘大小可根据需要调整,即通过改变board_n的值来调整,棋盘网格坐标的表示方法是比特位表示法,公式如下,其中a
i,j
表示某个成员a的坐标(i,j),该成员所在的网格区域,则网格区域board
i,j
置为1,若网格区域无任何成员,则该区域坐标为0A=[a
i,j
]
nxn
,3.根据权利要求1所述的一种基于离散空间的对抗性群集体系的阵型模拟优化系统,
其特征在于,所述的初始化模块具体如下:棋盘网格初始化;以初始坐标点(50,50)为基准点,间距为20mm,网格系数为N,构建该棋盘结构,网格坐标数值计算按照如下公式:博弈成员位置初始化;两队博弈中,设定两块随机出生区域其空间坐标用公式描述如下:下:random()是常用的随机函数,一个网格内只允许有一个成员,不可以挤占其他成员位置(无论队友还是对方成员),若初始化得到的任意两个成员坐标相同,则抛弃此次初始化结果,重新进行初始化操作;A队伍和B队伍成员位置的初始化算法分别如下:结果,重新进行初始化操作;A队伍和B队伍成员位置的初始化算法分别如下:初始化程序运行速度speed_factor。4.根据权利要求1所述的一种基于离散空间的对抗性群集体系的阵型模拟优化系统,其特征在于,所述的胜负判定模块具体如下:胜负判定模块可进行自定义编写,成员的攻击范围是其上、下、左、右共4个网格,为方便解释博弈规则,此处说明当本队伍中两名成员的某个攻击范围有重叠的情况下,攻击范围生效,即规则如下:A队成员A1的上、下、左、右中其中一个网格与成员A2的上、下、左、右其中一个网格具有相同坐标,则判定A队伍的两位成员的这两个打击网格当前处于重叠状态,那么此时该“重叠网格”判定为一个有效的打击范围网格;当B队伍的某个成员(B1/B2)的坐标进入A队的该打击网格,则判定为B队输,即如果有B成员进入此攻击范围,则该成员被吃掉,整个博弈过程结束,算法给出胜负数据,同理B队伍的整套打击规则同A规则完全相同,由于系统初始化模块的设置,会存在多个成员的情况,因此若进行更加复杂的研究,可对胜负判定模块进行定制。5.根据权利要求1所述的一种基于离散空间的对抗性群集体系的阵型模拟优化系统,其特征在于,所述的博弈树算法模块具体如下:博弈树中maxs节点是在当前局面下主动方所取得最优路径(即打分值最大)的值,它属于minmax博弈树中的后继子节点之一,mins节点属于在当前局面下被动方所取得最差结果的值(即对方选择了打分值最大后的结果),后继子节点用successor(n)表示,打分函数用utility(n)表示,博弈树模型的原理如下:
minmax
‑
value(n)=utility(n)maxs∈successor(n)minmax(s)mins∈successor(n)minmax(s)博弈树的状态转移方程式如下,S0为博弈的初始局面,qn+1为第n+1步的着法算子,而Sn+1为下完第n+1步后的棋局,因此博弈过程中存在的状态转移方程可表示为:S
n+1
=S
n
·
q
n+1
,S0=S(0)S
f
=S0·
q1·
q2·
…
·
q
f
=s0·
Q式中S
f
为终局,或A胜,或B胜,或平局,着法序列用于记载博弈过程如下:Q={q
1 q
1 q1ꢀ…ꢀ
q
n
}根据博弈树的算法原理,采用博弈树中的负极大值算法作为框架进行建模,一个走法对A的估值,等于其对B的估值的相反数;因此,当前算法要搜索的是一个使其估值的相反数最大化的走法——其后继的走法分数必须由对方评估,对当前是A还是B都适用,此为负极大值算法的运行原理,用公式表示如下:F(v)=
‑
max{
‑
F(v1),
‑
F(v2),
…
,
‑
F(vn)}value=
‑
NegaMax(p,d
‑
1)F(v)是在当前层级下对所有叶子节点的返回的结果取负最大值,value为算法在进行层序遍历时到最后一层后进行求极大值返回得到的结果;在树的遍历过程中,采用深度优先搜索方法进行遍历,在搜索过程中的任何时候仅仅生成整棵树的一小部分,搜索过的部分被立即删去;为提高博弈树搜索效率,将α
‑
β剪枝算法加入到负极大值算法中去,α
‑
β剪枝算法中每个节点有1个α和1个β,α表示当前该节点的最好下界,β表示当前节点的最好上界;开始α为负无穷,β为正无穷;进行搜索时,max层节点每搜索它的1个子节点,就要更新自身的α,而min层节点每搜索它的1个子节点,就要更新自身的β;当更新之后发现α>=β,则说明后面的子节点已经不需要进行搜索,直接剪掉。6.根据权利要求1所述的一种基于离散空间的对抗性群集体系的阵型模拟优化系统,其特征在于,所述的静态评估函数模块具体如下:博弈中任意一个队伍的总价值就是该队伍成员*成员价值,该公式如下,其中n为队伍中成员的递增序列,遍历每一个成员,都存在成员i当前的得分membervalue(i),得分由静态评估函数提供的;一个估值函数可以从若干角度评价某一局面上博弈双方的优劣程度;将这些不同方面的评价得分加总在一起,即构成了一方的价值总和,如果仅仅看两个博弈队伍的话,一个局面的总估值tv就是一方和另一方的价值差,表达如下式:为了对模型进行量化,设定评估函数为G(s),s为当前的局面,G(s)为当前局面的评估值,引入评估函数G(s)的,模型如下:
G(s)=a1f1(s)+a2f2(s)+
…
+a
n
f...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。