基于深度强化学习的复杂约束下航天器姿态规划方法技术

技术编号：38540293 阅读：29 留言：0更新日期：2023-08-19 17:08

本发明专利技术针对禁止指向约束下的航天器姿态机动规划问题，提出了一种基于深度强化学习的复杂约束下航天器姿态规划方法。本发明专利技术方法综合考虑旋转路径最短、能量最优、禁止指向约束、动力学约束等，通过深度强化学习训练得出了一个简洁的多重约束模型，可以确定姿态机动的近似最优路径，适用于微型航天器的控制。训练好的模型可以直接对起始、目标姿态进行端到端的推理，相较于传统方法的低求解效率，以及高复杂精确模型度，本发明专利技术具有相对高效且简单的求解过程以及较强的泛化性能。仿真结果表明规划结果满足所有约束，包括4个禁止指向约束、动力学约束等等。学约束等等。学约束等等。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度强化学习的复杂约束下航天器姿态规划方法

[0001]本专利技术涉及卫星姿态机动规划领域，涉及一种基于深度强化学习的复杂约束下航天器姿态规划方法。

技术介绍

[0002]随着航天技术的快速发展和人类太空探索频率的不断提高，世界航天发射活动呈逐年增多趋势，航天任务不断向多样化、无人自主化方向发展。以航天、深空探测等为代表的新兴航天任务近年来不断受到航天大国的关注和投入。这些任务要求航天器进行大量姿态机动，在姿态机动过程中，航天器必须满足一系列的姿态指向约束。
[0003]姿态指向约束包括禁止指向约束：一些光敏热敏元件(星敏感器、红外摄像机、低温冷却望远镜等)不能暴露在太阳等强光源或热源下，即敏感元件不能对准强光(热)源的方向；其次是强制指向约束：对目标进行观测时，光学镜头要指向观测目标；太阳能帆板需要一直对准太阳以保持电力供应，星载天线需要指向地面站以保证数据传输等。在哈勃空间望远镜、深空一号探测器以及卡西尼探测器上都存在着这些姿态指向约束，这极大地限制了航天器在姿态机动过程中的可行区域。
[0004]姿...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的复杂约束下航天器姿态规划方法，其特征在于，构建基本航天器姿态描述方式，建立禁止指向约束、控制力矩约束、角速度约束以及姿态运动学和动力学约束，通过设定初始姿态、目标姿态以及禁止指向区域，将三维姿态天球中姿态机动问题，转化为二维平面路径规划问题；基于所述二维平面路径规划问题对初始训练环境、动作、状态及奖励进行设定，然后建立深度强化学习模型并对模型进行训练，得到训练好的模型；将初始姿态、目标姿态以及随机环境输入训练好的模型中，得到卫星规划路径。2.根据权利要求1所述一种基于深度强化学习的复杂约束下航天器姿态规划方法，其特征在于，构建所述基本航天器姿态描述方式，具体为，采用欧拉轴/角和单位四元数描述航天器姿态，具体公式如下：式中:q0、q
v
分别为四元数的标部和矢部，q1,q2,q3分别表示q
v
在复数平面内的三个分量；e
x
,e
y
,e
z
分别表示欧拉旋转轴对应的三轴分量；θ表示航天器绕欧拉旋转轴e的旋转角。3.根据权利要求2所述一种基于深度强化学习的复杂约束下航天器姿态规划方法，其特征在于，所述禁止指向约束为：其中，r
b
表示敏感光学元件在航天器体坐标系下的方向向量，r
I
表示强光天体在惯性坐标系下的方向向量，C
bI
表示从惯性坐标系到航天器体坐标系的姿态转移矩阵，φ代表了敏感光学元件的视场角。4.根据权利要求1所述一种基于深度强化学习的复杂约束下航天器姿态规划方法，其特征在于，所述控制力矩约束为：|T
i
|＜γ1，i＝1,2,3其中，T
i
表示航天器的控制力矩，i代表在三轴上的分量；γ1表示航天器的控制力矩上限幅值。5.根据权利要求1所述一种基于深度强化学习的复杂约束下航天器姿态规划方法，其特征在于，所述角速度约...

【专利技术属性】
技术研发人员：赵凡宇，江姝蕾，陈悦洁，金仲和，时中，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人