一种基于DQN与微分博弈的轨道追逃博弈策略方法技术

技术编号：40940314 阅读：21 留言：0更新日期：2024-04-18 14:57

本发明专利技术公开了一种基于DQN与微分博弈的轨道追逃博弈策略方法，属于航空航天技术领域。方法包括根据微分博弈理论，设计追击航天器与逃逸航天器控制律样式库，构建博弈对抗动作集；追击者通过DQN模型在博弈对抗动作集挑选得到，逃逸者在博弈对抗动作集随机选择；通过航天器轨道动力学模型对所获取的追击者及逃逸者进行轨道推演；根据轨道推演结果对DQN模型进行调整，直至DQN模型训练损失收敛至平稳，生成轨道追逃博弈策略。本发明专利技术在增大追击者运行范围的同时，还能够使追击者的快速、准确的拦截追击者。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及航空航天，具体涉及一种基于dqn与微分博弈的轨道追逃博弈策略方法。

技术介绍

1、随着航天技术的不断发展，航天器数量持续增加，任务能力迅速提升，空间环境也日趋复杂。由于航天技术提升飞速，空间作战体系初步构建，我国空间安全面临巨大威胁。因此，我方航天器需要具备相应的空间博弈对抗能力，以确保更好地完成任务。

2、在空间轨道博弈问题中，追逃问题是一个经典且应用广泛的问题，涉及的博弈模型也颇具代表性。对于这一问题的解决，目前主要有两类方法，一是以微分博弈理论为代表的传统方法，二是以深度强化学习为代表的人工智能方法。这两类方法各有其优缺点。传统方法，如微分博弈等，具有解决过程清晰、理论性强的优势，但其解决结果的适用范围有限，导致追击者的运行范围有限。而基于深度强化学习(dqn)等算法的方法，则具有较好的泛化能力，但在训练过程中奖励函数难以收敛，导致追击者的无法快速、准确的逮捕逃逸者。

技术实现思路

1、针对现有技术中存在的追击者的运行范围有限及导致追击者的无法快速、准确的逮...

【技术保护点】

1.一种基于DQN与微分博弈的轨道追逃博弈策略方法，其特征在于，包括：

2.根据权利要求1所述的一种基于DQN与微分博弈的轨道追逃博弈策略方法，其特征在于，所述根据微分博弈理论，设计追击航天器与逃逸航天器控制律样式库，具体方式如下：

3.根据权利要求1所述的一种基于DQN与微分博弈的轨道追逃博弈策略方法，其特征在于，所述博弈对抗动作集包括追击者控制律样式库及逃逸者控制律样式库。

4.根据权利要求1所述的一种基于DQN与微分博弈的轨道追逃博弈策略方法，其特征在于，所述航天器轨道动力学模型的具体方式如下：

5.根据权利要求1所述的一种基于DQN...

【技术特征摘要】

1.一种基于dqn与微分博弈的轨道追逃博弈策略方法，其特征在于，包括：

2.根据权利要求1所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法，其特征在于，所述根据微分博弈理论，设计追击航天器与逃逸航天器控制律样式库，具体方式如下：

3.根据权利要求1所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法，其特征在于，所述博弈对抗动作集包括追击者控制律样式库及逃逸者控制律样式库。

4.根据权利要求1所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法，其特征在于，所述航天器轨道动力学模型的具体方式如下：

5.根据权利要求1所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法，其特征在于，所述通过航天器轨道动力学模型对所获取的追击者及逃逸者进行轨道推演，轨道推演结束通过博弈结束条件控制，其中，博弈结束条件具体方式如下：

6.根据权利要求5所述的一种基于dqn与微分博弈的轨道追逃博弈策略方法，其特征在于，所述逃逸者与追击者之间的相对距离的具体...

【专利技术属性】
技术研发人员：党朝辉，孙钦伯，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人