【技术实现步骤摘要】
一种平流层飞艇三维轨迹跟踪控制方法及系统
[0001]本专利技术涉及飞艇轨迹跟踪控制
,特别是涉及一种平流层飞艇三维轨迹跟踪控制方法及系统。
技术介绍
[0002]平流层飞艇是一种典型的轻于空气的飞行器,一般工作于平流层下层约18~22km高度处,相较于传统航空器和航天器,具有独特的区域长期驻留能力,在侦察预警、通信中继、移动互联网、环境探测等领域具有巨大应用潜力。可控飞行是平流层飞艇实现区域长期驻留能力的核心关键技术之一,有效的轨迹跟踪控制是可控飞行的重要内容。
[0003]平流层飞艇控制系统设计显著区别于飞机、导弹等传统飞行器,主要难点和挑战在于:大尺度柔性体动力学模型参数摄动严重、不确定性强;运动速度与环境风速在一个量级,受环境风场干扰影响大,且环境风场短周期变化性强;大惯量、长时延、欠驱动特征明显。工程实际中,传统基于动力学模型的控制策略,在状态反馈和参数辨识方面存在较大的控制误差。人工智能技术的发展,使得不依赖于动力学模型的控制方法受到重视,其中,利用智能体与环境交互经验的强化学习(Reinforce ...
【技术保护点】
【技术特征摘要】
1.一种平流层飞艇三维轨迹跟踪控制方法,其特征在于,所述方法包括:步骤S1:设置全局初始化参数;所述全局初始化参数包括:迭代总次数、初始化迭代次数k=1和六个元素;所述六个元素包括状态空间S、动作空间A、观测空间Z、转移函数T、观测函数O和回报值函数R;步骤S2:基于六个元素建立用于平流层飞艇三维轨迹跟踪控制问题的POMDP初始模型,并采用GPDM拟合方法将POMDP初始模型中的未知函数转换为拟合问题,获得POMDP模型;所述POMDP模型为动作
‑
观测序列的概率密度分布函数;步骤S3:采用在线规划算法更新所述POMDP模型的动作集;步骤S4:判断迭代次数k是否小于迭代总次数;如果迭代次数k小于迭代总次数,则令k=k+1,并返回“步骤S2”;如果迭代次数k大于或等于迭代总次数,则根据更新后的动作集控制平流层飞艇飞行。2.根据权利要求1所述的平流层飞艇三维轨迹跟踪控制方法,其特征在于,所述基于六个元素建立用于平流层飞艇三维轨迹跟踪控制问题的POMDP初始模型,并采用GPDM拟合方法将POMDP初始模型中的未知函数转换为拟合问题,获得POMDP模型,具体包括:步骤S21:基于六个元素建立用于平流层飞艇三维轨迹跟踪控制问题的POMDP初始模型;步骤S22:采用GPDM拟合方法将POMDP初始模型中的未知函数转换为两个未知权值系数集合B和C;所述未知函数包括转移函数T、观测函数O以及回报值函数R;步骤S23:按照设置的仿真时长和期望参数三维轨迹对两个未知权值系数集合B和C分别进行迭代拟合,确定拟合权值系数集合B
′
和C
′
;步骤S24:不考虑Markov特性,针对拟合权值系数集合C
′
,通过在拟合权值系数集合C
′
上指定各向同性的高斯先验,并进行边缘化处理,获得第一概率密度分布函数;步骤S25:考虑Markov特性,针对拟合权值系数集合B
′
,通过在拟合权值系数集合B
′
上指定各向同性的高斯先验,并进行边缘化处理,获得第二概率密度分布函数;步骤S26:采用根据贝叶斯规则,根据第一概率密度分布函数和第二概率密度分布函数确定动作
‑
观测序列的概率密度分布函数。3.根据权利要求1所述的平流层飞艇三维轨迹跟踪控制方法,其特征在于,所述采用在线规划算法更新所述POMDP模型的动作集,具体包括:步骤S31:设置局部初始化参数;所述局部初始化参数包括第t时刻的状态分布函数b
t
以及时域树深度d;步骤S32:根据所述时域树深度d对所述动作空间A进行划分,获得M个动作子集;步骤S33:从第i个动作子集中随机选择第t时刻的动作a
t
,基于转移函数T和第t时刻的动作a
t
进行预测,获得观测值和回报奖励值r
t
;步骤S34:根据第t时刻状态分布函数b
t
、动作a
t
、观测值和回报奖励值r
t
进行GPDM拟合处理,得到第t+1时刻的状态函数分布b
t+1
;步骤S35:利用R=R+γr
t
计算累计回报奖励值;其中,γ表示折扣因子,R表示累计回报奖励值;步骤S36:判断所述累计回报奖励值R是否小于奖励设定值R*;如果所述累计回报奖励值R小于奖励设定值R*,则执行“步骤S37”;如果所述累计回报奖励值R大于或等于奖励设定
值R*,则令当前选择的动作作为第t时刻的实际动作,并令R*=R,执行“步骤S37”;步骤S37:令b
t
=b
t+1
,并判断i是否小于M;如果i小于M,则令i=i+1,并返回“步骤S33”;如果i大于或等于M,则输出更新后的动作集。4.根据权利要求2所述的平流层飞艇三维轨迹跟踪控制方法,其特征在于,计算第一概率密度分布函数的具体公式为:其中,表示第一概率密度分布函数,W表示包含p+1阶比例因子的对角矩阵,N表示空间序列大小,p表示对角矩阵阶数,K
Y
表示核矩阵,Y表示联合观测空间,S表示状态空间,A表示动作空间,表示超参数。5.根据权利要求4所述的平流层飞艇三维轨迹跟踪控制方法,其特征在于,计算第二概率密度分布函数的具体公式为:其中,表示第二概率密度分布函数,表示超参数,p(s1)表示初始状态值为s1的概率,m、n分别表示序列大小,K
X
表示核矩阵,S
out
表示潜在空间中的不可观测状态。6.根据权利要求5所述的平流层飞艇三维轨迹跟踪控制方法,其特征在于,计算动作
‑
观测序列的概率密度分布函数的具体公式为:其中,表示动作
‑
观测序列的概率密度分布函数,表示超参数对应的条件概率密度分布函数...
【专利技术属性】
技术研发人员:杨希祥,刘多能,杨晓伟,王曰英,杨燕初,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。