【技术实现步骤摘要】
卫星东西保持策略模型的建模方法、模型、获取方法
[0001]本专利技术涉及航空航天
,特别是涉及一种卫星东西保持策略模型的建模方法、模型、获取方法、设备、介质。
技术介绍
[0002]随着人类航天活动的不断开展,越来越多的遥感卫星为人们的日常生活提供帮助。
[0003]GEO卫星在运行的过程中会受到日、月引力和地球非球形摄动的影响,从而导致在东西方向上发生漂移,所以对GEO三轴稳定卫星东西位置保持控制对于航天领域有至关重要的作用。
[0004]现有的技术方法首先分析了卫星东西漂移是由于卫星在轨道运行过程中受到的地球形状和太阳光压等各种摄动力的影响所导致卫星的平经度和偏心率发生变化,然后根据摄动力进行建模并制定东西保持的策略,进而对保持参数进行优化并且计算推进剂的消耗量。现有技术方法通过对卫星在轨道运行过程中受到的各种摄动力进行复杂的建模,然而由于空间受力的复杂性以及卫星本身参数的不确定性,导致无法对卫星进行精确建模,参数多、计算复杂,进而影响卫星东西控制的精度,可能会消耗更多的燃料。
[0005 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度Q网络的卫星东西保持策略模型的建模方法,其特征在于,包括以下步骤:S1:初始化模型,获取多组卫星训练状态数据组,每组卫星训练状态数据组包括卫星的初始状态、多个预期轨控时刻和预期轨控次数;每个卫星的初始状态包括初始时刻卫星状态;卫星状态包括平经度和偏心率矢量;S2:向模型中输入一组卫星训练状态数据组的初始时刻卫星状态,得到初始时刻之后所有切向控制行为及所对应输出的Q值;S3:获取当前时刻卫星状态,根据贪心策略获得卫星执行的切向控制行为;S4:执行切向控制行为,得到下一时刻卫星状态;根据下一时刻卫星状态、东西保持策略奖励函数得到奖励;所述东西保持策略奖励函数采用公式1:其中,r
t
为当前时刻卫星进行切向控制行为所获得的奖励,R0为标称轨道的平经度,e0为标称轨道的偏心率,ΔR
s
为平经度保持圆半径,Δe
s
为偏心率保持圆半径,R
t+1
为当前时刻的下一时刻卫星平经度,e
t+1
为当前时刻的下一时刻卫星偏心率矢量;t0为预期轨控时刻;t为当前时刻;S5:将当前时刻卫星状态、卫星执行的切向控制行为、奖励和下一时刻卫星状态作为一组卫星组合状态数据组存入经验池中;S6:从经验池中取出多组卫星组合状态数据组,根据神经网络权值参数计算每个卫星组合状态数据组的目标值;S7:根据损失函数计算误差,并更新神经网络权值参数;S8:根据值函数更新Q值;将下一时刻卫星状态作为当前时刻卫星状态;S9:重复执行步骤S3
‑
S8,执行步骤S3
‑
S8的次数等于该组卫星训练状态数据组的预期轨控次数;S10:重复执行步骤S2
‑
S9,直到输入完所有卫星训练状态数据组的数据。2.根据权利要求1所述的基于深度Q网络的卫星东西保持策略模型的建模方法,其特征在于,步骤S1中,卫星平经度的获得方法采用公式2:其中,R表示卫星平经度,a
s
为地球静止轨道半长轴,a
o
为卫星的轨道半长轴;卫星偏心率矢量获得方法采用公式3:其中,e表示卫星偏心率,Ω表示卫星升交点赤经,ω表示近地点幅角;卫星在轨道上的二维偏心率矢量为(e
x
,e
y
)。
3.根据权利要求1所述的基于深度Q网络的卫星东西保持策略模型的建模方法,其特征在于,步骤S3中,所述根据贪心策略获得卫星执行的切向控制行为的方法包括:卫星以第一指定概率随机选择切向控制行为、或以第二指定概率执行最大Q值所对应的切向控制行为;第一指定概率和第二指定概率之和等于1。4.根据权利要求1所述的基于深度Q网络的卫星东西保持策略模型的建模方法,其特征在于,步骤S6中,所述根据神经网络权值参数计算每个卫星组合状态数据组的目标值的方法采用公式4:其中,y
j
表示目标值,γ为折扣值,w为神经网络权值参数,表示一组卫星组合状态数据组中下一时刻卫星执行切向控制行为a后的最大Q值,s
j+1
表示一组卫星组合状态数据组中的下一时刻卫星状态,a表示卫星执行的切向控制行为,r
j
表示一组卫星组合状态数据组中的奖励。5.根据权利要...
【专利技术属性】
技术研发人员:吴琳琳,吴新林,何镇武,吴凌根,陈倩茹,王丽颖,张琳娜,
申请(专利权)人:北京航天驭星科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。