一种基于迁移学习鸽群优化的无人机空战博弈方法技术

技术编号:30769722 阅读:49 留言:0更新日期:2021-11-10 12:36
本发明专利技术公开一种基于迁移学习鸽群优化的无人机空战博弈方法,步骤一:初始化空战博弈环境设置;步骤二:设计可扩展的强操纵性博弈机动库;步骤三:设计空战态势评估函数,计算博弈得分矩阵;步骤四:构造空战博弈适应度函数;步骤五:基于迁移学习鸽群优化的博弈机动策略选择;步骤六:更新六自由度飞机状态。本发明专利技术优点:1)控制对象为真实的六自由度非线性飞机模型,更具实际应用价值;2)引入机动决策向量,构造适应度函数,将博弈得分矩阵的纳什均衡转化为线性规划问题求解,有效提高了空战决策效率;3)将迁移学习机制引入鸽群优化极大提高了算法搜索效率。算法搜索效率。算法搜索效率。

【技术实现步骤摘要】
一种基于迁移学习鸽群优化的无人机空战博弈方法


[0001]本专利技术是一种基于迁移学习鸽群优化的无人机空战博弈方法,属于空战自主决策领域。

技术介绍

[0002]自主空战是未来战争的重要方式之一,无人作战飞机(Unmanned Combat Aerial Vehicle,UCAV)是自主空战中的主要力量,空战能力的强弱很大程度上决定了战争的主导权。自主空战过程可以分为三部分:态势感知、自主决策、指令执行。其中,自主决策是空战过程的核心。根据方法核心的不同,可将自主决策方法划分为三类:数学求解、机器博弈、数据驱动。数学求解法将空战博弈转化为优化问题,可分为单目标和多目标优化,设计目标函数,求得最优解;机器博弈法将空战双方的机动动作指令离散化,进而对全空间或有限空间的机动动作计算态势函数,构成博弈支付矩阵,利用搜索算法选择最佳机动动作;数据驱动法基于神经网络、模糊算法、强化学习等展开,该类算法一种是对相关数据进行训练,输入为战场态势数据,输出为选择的机动动作,另一种是采用预测手段对战场态势、敌我双方动作进行预测,继而选择合适的机动决策方案。机器博弈本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于迁移学习鸽群优化的无人机空战博弈方法,其特征在于:该方法包括如下步骤:步骤一:初始化空战博弈环境设置,具体包括:搭建红蓝对抗双方六自由度空战运动模型及控制律结构;初始化红蓝战机本体参数及机载武器参数;初始化红蓝战机初始态势;初始化空战博弈系统仿真参数;其中,所述的运动模型采用真实飞机的六自由度非线性运动模型;步骤二:设计可扩展的强操纵性博弈机动库六自由度非线性飞机模型的控制指令为迎角和滚转角指令,通过战术规划层的计算,将决策层产生的待选机动指令转换成六自由度飞机的控制层指令形式,作为输入信息输入到飞机的自动驾驶仪回路,利用飞机质心运动学方程组简化决策模型;切向过载、法向过载、速度滚转角作为机动指令生成器的输入,飞行速度、航迹倾角、航向角作为输出,实现对飞机运动轨迹的控制;具体的,实现某一机动动作的具体思路为:首先确定完成此机动动作时控制量的要求值,然后根据限制条件得出控制量的可用值,再将可用值代入运动方程组积分得到不同时刻的运动参数;实现些典型战术机动动作,是将机动指令转换成控制层指令,即法向过载、速度滚转角,构成机动动作库,通过不同的法向过载与速度滚转角的组合即可实现相应的机动动作,对六自由度飞机非线性模型而言,通过基于迎角和滚转角指令的自动驾驶仪,根据机动动作库已经生成的法向过载和速度滚转角的控制指令,保持六自由度飞机的油门杆位置不变,将速度滚转角作为滚转角指令输入到滚转角自动驾驶仪回路,再将法向过载指令转换成迎角指令输入到飞机的迎角自动驾驶仪回路,即实现了六自由度飞机的机动动作控制;机动动作库可以表示为:n
f
=[n
f1
,n
f2
,...,n
fu
]
u
(6)γ=[γ1,γ2,...,γ
w
]
w
(7)其中,n
f
,γ分别表示法向过载和速度滚转角取值向量,u,w分别对应它们的维数,它们取不同的值,即可组合出不同的机动动作;L为博弈机动库,由n
f
,γ对应取值组合而成,可生成u
×
w个机动动作;红蓝双方机动动作库中所有动作组合,可构成如下博弈机动矩阵:其中,L
rm
L
bn
表示红方选取机动库中第m个机动动作,蓝方选取机动库中第n个机动动作;步骤三:设计空战态势评估函数,计算博弈得分矩阵定义空战态势评估函数的两个组成部分:角度威胁指数和距离威胁指数,具体定义如下:
角度威胁指数:其中,S
A
为角度威胁指数;A
R
为红方飞机速度方向与红蓝双方飞机连线方向的夹角;A
B
为蓝方飞机速度方向与红蓝双方飞机连线方向的夹角;距离威胁指数:S
R
=e

(R

r)/k
(11)其中,S
R
为距离威胁指数;R为双机距离;r为红蓝双方机炮的平均攻击范围,r=(r
r
+r
b
)/2;k为灵敏度;态势评估函数为上述两个因素指数的乘积,记为:S=S
A
S
R
(12)其中,S为态势评估函数,S
A
为角度威胁指数;S
R
为距离威胁指数;上述评估函数S的值越大,代表红方越占优,相反,S越小,代表蓝方越占优;博弈支付矩阵,即针对每一步红蓝双方的状态,对应机动动作库,分别计算双方每种动作下的态势评估函数,即构成博弈得分矩阵;根据上述态势评估函数,可以分别计算双方采用每种动作组合的得分结果,得到博弈得分矩阵如下:其中,SS为博弈得分矩阵;s
mn
表示博弈矩阵中第m行n列的机动动作对应的态势评估函数值;期望态势评估函数值越大对该方越有利;步骤四:构造空战博弈适应度函数设红方无人机以概率pro
i
选择机动动作库中第i个动作,则对于动作库中n个机动动作会生成一个机动决策向量PRO=[pro1,pro2,...pro
n
]
T
,将博弈得分矩阵的纳什均衡转化为线性规划问题求解,则构造适应度函数如下:f
best
=max(fitness)(15)其中,SS
ij
表示博弈得分矩阵的第i行,第j列对...

【专利技术属性】
技术研发人员:段海滨阮婉莹邓亦敏魏晨周锐
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1