基于安全强化学习的航天器可变数量空间碎片避撞自主决策方法技术

技术编号：41252495 阅读：34 留言：0更新日期：2024-05-10 00:00

本发明专利技术公开了基于安全强化学习的航天器可变数量空间碎片避撞自主决策方法，所述方法包括以下步骤：步骤一：根据地心惯性坐标系下构建航天器的空间动力学模型；步骤二：根据航天器与空间碎片轨道动力学构建碰撞概率数学模型；步骤三：基于碰撞时间的空间碎片仿真参数生成；步骤四：建立仿真训练环境；步骤五：根据安全强化学习算法建立航天器避撞自主决策训练系统；步骤六：离线训练航天器避撞自主决策模型；步骤七：训练好的航天器避撞自主决策模型应用于在线航天器多个空间碎片避撞场景中；本发明专利技术以适应可变空间碎片数量的规避问题，同时满足航天器规避约束并提升航空器的能源利用率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及航天器避撞领域，具体涉及基于安全强化学习的航天器可变数量空间碎片避撞自主决策方法。

技术介绍

1、随着全球航天事业快速发展，世界范围内卫星发射次数也是逐年攀升，全世界先后有超过三十多个国家和地区相继进行了发射任务。进入21世纪，出于国家军事战略安全的需要，世界各国进行卫星发射的任务越来越紧迫，发射活动也愈发频繁。然而由于宇宙空间资源的有限，特别是近地空间以及地球同步轨道空间的有限性，导致地球附近的空间碎片数量迅速攀升，这些无效载荷严重污染了地球周围的空间环境，对在轨航天器的安全运行、卫星任务执行以及火箭发射的窗口期都产生了广泛且严重影响。现有的空间碎片避撞问题研究多是基于简化的相对运动学模型，并且采用离线的数学优化方法得出最优机动量。但传统的优化算法求解速度无法满足航天器在轨实时避障决策需求，并且难以适用于可变数量的空间碎片场景中，所以有必要对有限推力空间飞行器在轨实时自主避障机动决策进行研究。

2、因此，设计基于安全强化学习的航天器可变数量空间碎片避撞自主决策方法能够实现单次训练即可自主规避数量不定的空间碎片...

【技术保护点】

1.基于安全强化学习的航天器可变数量空间碎片避撞自主决策方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的基于安全强化学习的航天器可变数量空间碎片避撞自主决策方法，其特征在于，所述Actor网络、Critic网络和Cost网络均采用全连接神经网络模型，LSTM为RNN网络：

3.根据权利要求1-2任一项所述的基于安全强化学习的航天器可变数量空间碎片避撞自主决策方法，其特征在于，所述步骤四中航天器碰撞仿真参数建立航天器碰撞仿真环境过程，包括：

【技术特征摘要】

1.基于安全强化学习的航天器可变数量空间碎片避撞自主决策方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的基于安全强化学习的航天器可变数量空间碎片避撞自主决策方法，其特征在于，所述actor网络、critic网络和...

【专利技术属性】
技术研发人员：穆朝絮，刘硕，蔡光斌，汪韧，孙长银，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人