一种基于自适应动态规划的不完全信息下航天器博弈控制方法及装置制造方法及图纸

技术编号:46546218 阅读:1 留言:0更新日期:2025-10-10 21:09
本发明专利技术公开了一种基于自适应动态规划的不完全信息下航天器博弈控制方法及装置,属于航天技术领域。所述方法包括建立航天器追逃博弈相对运动模型,通过固定时间扩张状态观测器估计非合作目标的未知策略和空间扰动;基于估计状态构建不完全信息追逃博弈模型,设计自适应动态规划博弈策略,利用神经网络逼近最优博弈策略;引入Ada‑delta方法自适应调整神经网络学习率,提升收敛效率;基于超二次曲面构建逃逸航天器外形模型,结合势函数确保碰撞避免;通过固定时间补偿项解决时间约束问题,实现固定时间内近似最优博弈策略。本发明专利技术在保证安全性的同时,有效解决了不完全信息下航天器博弈控制的时间约束和策略优化问题。

【技术实现步骤摘要】

本专利技术属于航天,具体涉及一种基于自适应动态规划的不完全信息下航天器博弈控制方法及装置


技术介绍

1、非合作目标由于其机动信息不可知、机动行为不配合、状态信息不沟通等不确定性特征,为控制器的设计带来诸多挑战。将诸如非合作目标的在轨接近与拦截等任务抽象为在轨追逃博弈问题,基于博弈理论获得不完全信息下的追踪航天器与逃逸航天器的博弈策略是一种可行的求解策略。在航天器追逃博弈任务中,考虑了非合作目标接近过程中的极端性场景,即追踪星和逃逸星的目标相反,追踪星旨在尽快抵近到逃逸星的抓捕或交会位置,而逃逸星则以躲避追踪星为自身任务。

2、在已有的研究工作中,通过建立二次型微分博弈策略,利用代数黎卡提方程求解最优博弈策略是一种被广泛研究的最优博弈策略求解方法。其中,零和博弈下假设缺乏工程应用上的可行性,其依赖于对手行为策略和实时状态的可知性,也就是所谓的“完全信息假设”所有参与者都能获取其他参与者的状态和策略。然而,在实际场景中,信息常常是部分可得的,也就是不完全的,参与者可能无法准确了解他人的意图和决策,在这种情况下,基于零和博弈假设的博弈策略无法基于部本文档来自技高网...

【技术保护点】

1.一种基于自适应动态规划的不完全信息下航天器博弈控制方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于自适应动态规划的不完全信息下航天器博弈控制方法,其特征在于,所述步骤1中航天器追逃博弈相对运动模型为:

3.根据权利要求2所述的一种基于自适应动态规划的不完全信息下航天器博弈控制方法,其特征在于,所述步骤2中,设计的固定时间扩张状态观测器如下:

4.根据权利要求3所述的一种基于自适应动态规划的不完全信息下航天器博弈控制方法,其特征在于,所述步骤3基于自适应动态规划的航天器博弈策略为:

5.根据权利要求4所述的一种基于自适应...

【技术特征摘要】

1.一种基于自适应动态规划的不完全信息下航天器博弈控制方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于自适应动态规划的不完全信息下航天器博弈控制方法,其特征在于,所述步骤1中航天器追逃博弈相对运动模型为:

3.根据权利要求2所述的一种基于自适应动态规划的不完全信息下航天器博弈控制方法,其特征在于,所述步骤2中,设计的固定时间扩张状态观测器如下:

4.根据权利要求3所述的一种基于自适应动态规划的不完全信息下航天器博弈控制方法,其特征在于,所述步骤3基于自适应动态规划的航天器博弈策略为:

5.根据权利要求4所述的一种基于自适应动态规划的不完全信息下航天器博弈控制方法,其特征在于,所述步骤4包括通过引入历史梯度信息,实现学习速率的快速自适应调...

【专利技术属性】
技术研发人员:师鹏宋硕郭琦张涛孔祥皓龚胜平
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1