轨道威胁环境下的启发式航天器自主规避任务规划方法技术

技术编号:39677042 阅读:11 留言:0更新日期:2023-12-11 18:43
本发明专利技术公开了轨道威胁环境下的启发式航天器自主规避任务规划方法,包括:对航天器进行初始化配置;建立航天器轨道威胁自主规避的任务规划模型;设计航天器自主规避架构;设置两阶段规划策略,在规划的第一阶段继续进行观测任务,如果在规避行为决策中需要通过航天器的动作来规避轨道威胁,观测任务立即中断,并进行第二阶段的规划,第二阶段的规划用于规避轨道威胁;对规划问题进行时间约束推理和包含资源变量的数字效应推理;检查每个状态下相互作用的时间约束和资源变量约束的一致性;采用时间松弛规划图启发式指导规划通过搜索空间到达目标;本发明专利技术的优点在于:实现航天器自主及时处置空间威胁

【技术实现步骤摘要】
轨道威胁环境下的启发式航天器自主规避任务规划方法


[0001]本专利技术涉及航天器任务规划领域,具体涉及轨道威胁环境下的启发式航天器自主规避任务规划方法


技术介绍

[0002][0003]然而,轨道空间日益拥挤

碰撞风险激增,太空竞争加剧

袭扰增多,给航天器任务执行带来了更多不确定性因素

可见,若无法对空间威胁进行有效处置,将严重影响航天器在轨运行的安全性和业务的连续性

同时,为了避免“星地大回路”造成的时延,就必须增强航天器自主及时处置空间威胁等不确定性的能力

[0004]中国专利公开号
CN114638082A
公开了一种通用的航天器启发式时态规划建模

求解方法,其特征在于:充分结合航天工程任务特点和实际需求,提出一种航天器领域通用模型及其数学表达,采用时态网络结构图表示航天器巡视探测状态转移的时间约束和能源约束,采用前向剪枝策略对网络结构图进行约束传播和问题求解,设计实现了一种基于最大时间跨度的启发式控制函数进行问题松弛,以提高求解效率

该方法所构建的领域模型表达更加完整,采用的时态网络结构图技术降低了规划求解计算的复杂度,且极大的简化了算法设计的复杂度

其主要是构建航天器领域通用模型,围绕该模型进行求解和计算,但是没有对航天器自主及时处置空间威胁进行相关描述


技术实现思路

[0005]本专利技术所要解决的技术问题在于如何提升航天器自主及时处置空间威胁等不确定性的能力

[0006]本专利技术通过以下技术手段解决上述技术问题:轨道威胁环境下的启发式航天器自主规避任务规划方法,包括:
[0007]步骤一:对航天器进行初始化配置;
[0008]步骤二:建立航天器轨道威胁自主规避的任务规划模型;
[0009]步骤三:分析航天器轨道威胁的场景,基于自主规避的任务需求,设计航天器自主规避架构;
[0010]步骤四:设置两阶段规划策略,在规划的第一阶段继续进行观测任务,在规避行为决策中,如果当前的轨道威胁对航天器不会造成伤害,则不需要规避,则整个规划中止,如果在规避行为决策中需要通过航天器的动作来规避轨道威胁,观测任务立即中断,并进行第二阶段的规划,第二阶段的规划用于规避轨道威胁;
[0011]步骤五:对规划问题进行时间约束推理和包含资源变量的数字效应推理,使资源变量在动态变化的过程中满足持续时间动作的执行;
[0012]步骤六:检查每个状态下相互作用的时间约束和资源变量约束的一致性,将不能满足时间约束的状态删除;
[0013]步骤七:采用时间松弛规划图启发式指导规划通过搜索空间到达目标

[0014]进一步地,所述步骤二包括:
[0015]航天器轨道威胁自主规避的任务规划模型表示为八元组
[0016]Π

<F

I

G

V

A

Q

P

C>
[0017]其中,
F
是航天器状态成立的事实;是初始航天器状态;是航天器实现威胁规避所需维持的目标状态;
V
是航天器资源的集合;
A
是一组能够改变航天器状态及其效果的动作,每个动作表示为
N
是动作的名称,
dur
是动作的持续时间,
dur
min

dur
max
分别是
act
的最小和最大持续时间,
pre
为前提条件,包括开始条件结束条件
pre

和不变条件
eff
是效果,包含开始效果和结束效果
eff


Q
是记录事件队列中执行已开始但未结束的动作;
P
表示从初始状态到当前状态的动作顺序;
C
是规划中动作的一组时间约束

[0018]更进一步地,所述步骤三中设计航天器自主规避架构包括可见光相机

全域相机

红外相机

微波雷达

激光雷达

多传感器信息融合单元

威胁目标行为信息计算单元

威胁等级推理单元

规避行为决策单元以及动作序列规划单元,采用全域

红外

激光

微波四种探测手段,根据所处的太空环境条件对传感器进行组合,对威胁目标的搜索捕获,并对威胁目标进行初始测距

测角,通过不同传感器设备间信息互补实现威胁识别,其次通过对传感器信息的融合,获取威胁目标的速度

距离

方位角信息,从而获取威胁目标的异动行为特征,目标轨道参数和碰撞概率;可见光相机实现近距离的成像获取形态特征;结合处理后的目标信息及航天器自身姿轨参数进行融合推理,得到对目标的威胁类别与威胁等级的定量评价,对航天器应采取的具体规避行为进行推理决策,预估威胁目标未来的动作行为,求解出实现威胁规避的最优轨迹;实时的将航天器自身参数反馈给威胁等级推理单元和动作序列规划单元

[0019]更进一步地,所述步骤五包括:
[0020]步骤
5.1
:将任务规划模型中每个持续时间动作
act
分解为两个非时间瞬时动作,形式为
<pre

eff>
,其中,表示开始瞬时动作,
act


<pre


eff

>
表示结束瞬时动作,规划中的每个状态表示为
S

<F

V

Q

P

C>
,应用动作
act
时,只有当
act
的效果与
Q
中任何动作的不变量不冲突时,才能应用
act
,并且根据其效果更新
F

V
,在将每个动作添加到规划时,都更新
C

[0021]步骤
5.2
:对于资源变量
V
,状态中有记录其下限值和上限值的向量
V
max

V
min
,存在连续数值变化的情况下,资源变量的值取决于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
轨道威胁环境下的启发式航天器自主规避任务规划方法,其特征在于,包括:步骤一:对航天器进行初始化配置;步骤二:建立航天器轨道威胁自主规避的任务规划模型;步骤三:分析航天器轨道威胁的场景,基于自主规避的任务需求,设计航天器自主规避架构;步骤四:设置两阶段规划策略,在规划的第一阶段继续进行观测任务,在规避行为决策中,如果当前的轨道威胁对航天器不会造成伤害,则不需要规避,则整个规划中止,如果在规避行为决策中需要通过航天器的动作来规避轨道威胁,观测任务立即中断,并进行第二阶段的规划,第二阶段的规划用于规避轨道威胁;步骤五:对规划问题进行时间约束推理和包含资源变量的数字效应推理,使资源变量在动态变化的过程中满足持续时间动作的执行;步骤六:检查每个状态下相互作用的时间约束和资源变量约束的一致性,将不能满足时间约束的状态删除;步骤七:采用时间松弛规划图启发式指导规划通过搜索空间到达目标
。2.
根据权利要求1所述的轨道威胁环境下的启发式航天器自主规避任务规划方法,其特征在于,所述步骤二包括:航天器轨道威胁自主规避的任务规划模型表示为八元组


<F,I,G,V,A,Q,P,C>
其中,
F
是航天器状态成立的事实;是初始航天器状态;是航天器实现威胁规避所需维持的目标状态;
V
是航天器资源的集合;
A
是一组能够改变航天器状态及其效果的动作,每个动作表示为
N
是动作的名称,
dur
是动作的持续时间,
dur
min

dur
max
分别是
act
的最小和最大持续时间,
pre
为前提条件,包括开始条件结束条件
pre

和不变条件
eff
是效果,包含开始效果和结束效果
eff


Q
是记录事件队列中执行已开始但未结束的动作;
P
表示从初始状态到当前状态的动作顺序;
C
是规划中动作的一组时间约束
。3.
根据权利要求2所述的轨道威胁环境下的启发式航天器自主规避任务规划方法,其特征在于,所述步骤三中设计航天器自主规避架构包括可见光相机

全域相机

红外相机

微波雷达

激光雷达

多传感器信息融合单元

威胁目标行为信息计算单元

威胁等级推理单元

规避行为决策单元以及动作序列规划单元,采用全域

红外

激光

微波四种探测手段,根据所处的太空环境条件对传感器进行组合,对威胁目标的搜索捕获,并对威胁目标进行初始测距

测角,通过不同传感器设备间信息互补实现威胁识别,其次通过对传感器信息的融合,获取威胁目标的速度

距离

方位角信息,从而获取威胁目标的异动行为特征,目标轨道参数和碰撞概率;可见光相机实现近距离的成像获取形态特征;结合处理后的目标信息及航天器自身姿轨参数进行融合推理,得到对目标的威胁类别与威胁等级的定量评价,对航天器应采取的具体规避行为进行推理决策,预估威胁目标未来的动作行为,求解出实现威胁规避的最优轨迹;实时的将航天器自身参数反馈给威胁等级推理单元和动作序列规划单元
。4.
根据权利要求3所述的轨道威胁环境下的启发式航天器自主规避任务规划方法,其
特征在于,所述步骤五包括:步骤
5.1
:将任务规划模型中每个持续时间动作
act
分解为两个非时间瞬时动作,形式为
<pre,eff>
,其中,表示开始瞬时动作,
act


<pre

,eff

>
表示结束瞬时动作,规划中的每个状态表示为
S

<F,V,Q,P,C>
,应用动作
act
时,只有当
act
的效果与
Q
中任何动作的不变量不冲突时,才能应用
act
,并且根据其效果更新
F

V
,在将每个动作添加到规划时,都更新
C
;步骤
5.2
:对于资源变量
V
,状态中有记录其下限值和上限值的向量
V
max

V
min
,存在连续数值变化的情况下,资源变量的值取决于时间
。5.
根据权利要求4所述的轨道威胁环境下的启发式航天器自主规避任务规划方法,其特征在于,所述步骤
5.1
还包括:每个规划步骤都有一个唯一索引,每个状态下的每个事实都用以下信息进行表示:
F
+
(p)(F

(p))
分别给出了最近添加

删除事实
p
的步骤
i
索引;
FP(p)
是一组对
<i,d>
具有前提条件
p
的步骤,
i
是步骤索引,
d∈{0,
ε
}

ε
表示时间间隔,如果
d
=0,记录步骤
i
是在一个区间的末尾,在此期间
p
需要保持,在这种情况下,
i
是一个动作的结束步骤,其中
p
是一个不变量条件;如果
d

ε
,记录步骤
i

p
需要保持的一个间隔开始,对应于与步骤
i
相关的开始或结束条件;在规划的步骤
i
中应用启动操作时,将向规划添加以下约束:对于每个添加时间约束
t(sstep)≥t(S.F
+
(p))+
ε
,其中,表示添加开始动作
act
T
,航天器需要满足的状态事实
p

S.F
+
(p)
代表航天器状态
S
中最近添加事实
p
的步骤
i
索引,
t(S.F
+
(p))
代表步骤索引
S.F
+
(p)
的时间戳,
t(sstep)
表示添加步骤索引
sstep
的时间戳,实现
p
的步骤被提前到步骤
i
之前;对于的每个负效应
p
,将
p
从状态中移除,添加约束
t(sstep)≥t(i)+
ε
,使删除步骤
i
发生在任何需要
p
的动作之后,其中
t(i)
表示步骤
i
索引的时间戳,负效应
p
表示添加完动作后删除航天器的一些状态;对于的每个正效应
p
,将
p
添加到状态,添加约束
t(sstep)≥t(S.F

(p)+
ε
,并且步骤
i
被记录为
p
的实现步骤,其中
t(S.F

(p)
表示步骤索引
S.F

(p...

【专利技术属性】
技术研发人员:陈兴文邱剑彬王桐罗姗秦晨辉
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1