【技术实现步骤摘要】
拟态物理法与DDQN结合的无人机集群空战决策方法
本专利技术属于无人机空战决策领域,特别是拟态物理法与DDQN结合的无人机集群空战决策方法。
技术介绍
无人机集群空战机动决策是指集群系统被投放到作战区域后,通过自主决策完成目标搜索、友军支援、合作打击等作战任务。与传统的多无人机作战相比,无人机集群系统作为一个有机整体,不依赖于中央决策系统的调度,是一种更高层次的智能表现。根据是否依赖于决策模型,决策方法可分为基于模型的解析方法和以专家系统、强化学习为代表的无模型方法。解析方法主要包括矩阵博弈、微分对策等,即首先建立空战模型,如影响图、策略评估函数、零和博弈等,然后通过自适应规划、差分进化算法、模拟退火算法等求解最优策略。然而,由于实际作战环境中的信息往往具有不确定性和不完备性等复杂特性,很难建立精确的决策模型,因此近年来无模型方法成为了研究热点。强化学习是一种不需要事先准备样本集的学习算法,比较适合应用于无样本或样本采集困难的军事领域。陈侠等通过建立无人机集群空战的马尔科夫决策过程(MarkovDecisionPro ...
【技术保护点】
1.拟态物理法与DDQN结合的无人机集群空战决策方法,其特征在于,包括以下步骤:/n步骤一,在无人机集群系统中,建立无人机的质点运动模型,建立无人机与其邻居个体之间、无人机与目标之间的相对几何位置关系。/n步骤二,对于由N架无人机组成的无人机集群系统,定义无人机UA V
【技术特征摘要】
1.拟态物理法与DDQN结合的无人机集群空战决策方法,其特征在于,包括以下步骤:
步骤一,在无人机集群系统中,建立无人机的质点运动模型,建立无人机与其邻居个体之间、无人机与目标之间的相对几何位置关系。
步骤二,对于由N架无人机组成的无人机集群系统,定义无人机UAVi的状态感知空间Ωi为其中为距离UAVi最近的架邻居个体组成的集合,为距离UAi最近的Naim个目标组成的集合。
步骤三,根据拟态物理法计算集群系统无人机UAVj∈Ωi对无人机UAVi相互作用力Fi,包括无人机之间避碰作用力和速度一致作用力。
步骤四,对于任意时刻t,计算无人机UAVi的状态
步骤五,为保证目标歼灭的成功率以及无人机之间的配合,利用目标的联合毁伤效能表示无人机之间的协作关系。根据无人机集群的集群回合平均收益,表示无人机之间相互配合具有的空战决策能力。
步骤六,各无人机在每次执行动作之后,通过对能源损耗、接近目标、对目标发动进攻后的联合打击回报、无人机被击毁的奖赏求和,得到总的奖赏。
步骤七,利用DDQN算法训练无人机集群,使空战机动策略收敛,得到最优策略,计算集群收益并统计空战时间。
2.如权利要求1所述的拟态物理法与DDQN结合的无人机集群空战决策方法,其特征在于,所述步骤一中在无人机集群系统中,建立无人机与其邻居个体之间、无人机与目标之间的相对几何位置关系,具体为:
(2.1)假设无人机UAVj为无人机UAVi的邻居个体,无人机UAVi在平面中的位置为速度为速度方向角为无人机UAVj在平面中的位置为速度为速度方向角为定义无人机集群中无人机UAVi与其邻居个体UAVj之间的相对几何位置为:
式中,为无人机之间的距离向量,为两机速度方向之间的夹角,Vij为两机相对速度,为UAVi的速度矢量与两机视线之间的夹角,为无人机间欧式距离。
(2.2)定义无人机UAVi与目标aimm之间的相对几何位置关系为
式中,为无人机UAVi与目标aima之间的距离向量,Pi为无人机UAVi的位置,Pm为目标aimm的位置。
3.如权利要求1所述的拟态物理法与DDQN结合的无人机集群空战决策方法,其特征在于,所述步骤四中,对于任意时刻t,计算无人机UAVi的状态具体为:
(3.1)为无人机UAVi可观测的UAVj∈Ωi的相对几何关系信息,由式(1)求得;
(3.2)为无人机UAV...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。