【技术实现步骤摘要】
本专利技术涉及航空航天,具体涉及一种基于dqn与微分博弈的轨道追逃博弈策略方法。
技术介绍
1、随着航天技术的不断发展,航天器数量持续增加,任务能力迅速提升,空间环境也日趋复杂。由于航天技术提升飞速,空间作战体系初步构建,我国空间安全面临巨大威胁。因此,我方航天器需要具备相应的空间博弈对抗能力,以确保更好地完成任务。
2、在空间轨道博弈问题中,追逃问题是一个经典且应用广泛的问题,涉及的博弈模型也颇具代表性。对于这一问题的解决,目前主要有两类方法,一是以微分博弈理论为代表的传统方法,二是以深度强化学习为代表的人工智能方法。这两类方法各有其优缺点。传统方法,如微分博弈等,具有解决过程清晰、理论性强的优势,但其解决结果的适用范围有限,导致追击者的运行范围有限。而基于深度强化学习(dqn)等算法的方法,则具有较好的泛化能力,但在训练过程中奖励函数难以收敛,导致追击者的无法快速、准确的逮捕逃逸者。
技术实现思路
1、针对现有技术中存在的追击者的运行范围有限及导致追击者的无法快速、准确的逮
...【技术保护点】
1.一种基于DQN与微分博弈的轨道追逃博弈策略方法,其特征在于,包括:
2.根据权利要求1所述的一种基于DQN与微分博弈的轨道追逃博弈策略方法,其特征在于,所述根据微分博弈理论,设计追击航天器与逃逸航天器控制律样式库,具体方式如下:
3.根据权利要求1所述的一种基于DQN与微分博弈的轨道追逃博弈策略方法,其特征在于,所述博弈对抗动作集包括追击者控制律样式库及逃逸者控制律样式库。
4.根据权利要求1所述的一种基于DQN与微分博弈的轨道追逃博弈策略方法,其特征在于,所述航天器轨道动力学模型的具体方式如下:
5.根据权利要求1
...【技术特征摘要】
1.一种基于dqn与微分博弈的轨道追逃博弈策略方法,其特征在于,包括:
2.根据权利要求1所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法,其特征在于,所述根据微分博弈理论,设计追击航天器与逃逸航天器控制律样式库,具体方式如下:
3.根据权利要求1所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法,其特征在于,所述博弈对抗动作集包括追击者控制律样式库及逃逸者控制律样式库。
4.根据权利要求1所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法,其特征在于,所述航天器轨道动力学模型的具体方式如下:
5.根据权利要求1所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法,其特征在于,所述通过航天器轨道动力学模型对所获取的追击者及逃逸者进行轨道推演,轨道推演结束通过博弈结束条件控制,其中,博弈结束条件具体方式如下:
6.根据权利要求5所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法,其特征在于,所述逃逸者与追击者之间的相对距离的具体...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。