【技术实现步骤摘要】
本申请涉及智能空管,特别是涉及一种基于生成对抗模仿学习的航空器进近规划方法及装置。
技术介绍
1、进近管制员作为空中交通管制中一个关键角色,通过使用雷达引导技术,从而确保航空器在到达最终进近点时保持安全间隔。进近管制过程主要依赖于管制员的决策,随着空中交通流量的增加,管制员需要在有限的时间内做出高效的决策,以确保航空器的安全飞行,为了提高管制效率并保证飞行安全,则需要采用一些技术手段来辅助管制员的决策过程。
2、当前,强化学习技术已应用于空管智能决策领域,取得了一定进展,然而,现有的基于强化学习的航空器辅助决策方法依然存在如下问题:现有方法中一般采用连续空间构建学习环境,存在解空间维度爆炸问题,影响其收敛速度和性能,同时,强化学习仅通过与仿真环境交互进行决策,航空决策中的专家知识并不能完全量化表达,导致输出的决策结果与专家知识差异较大,决策结果的可靠性和可解释性也大大降低。
3、因此,相关技术中,亟需一种能够提高航空器进近规划决策的效率与可靠性的方式。
技术实现思路
【技术保护点】
1.一种基于生成对抗模仿学习的航空器进近规划方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于生成对抗模仿学习的航空器进近规划方法,其特征在于,所述获取历史轨迹数据和历史飞行状态数据之前包括:
3.根据权利要求2所述的基于生成对抗模仿学习的航空器进近规划方法,其特征在于,所述基于所述历史轨迹数据确定专家进近规划动作序列包括:
4.根据权利要求1所述的基于生成对抗模仿学习的航空器进近规划方法,其特征在于,所述基于所述历史飞行状态数据和专家进近规划动作序列训练进近规划模型包括:
5.根据权利要求4所述的基于生成对
...【技术特征摘要】
1.一种基于生成对抗模仿学习的航空器进近规划方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于生成对抗模仿学习的航空器进近规划方法,其特征在于,所述获取历史轨迹数据和历史飞行状态数据之前包括:
3.根据权利要求2所述的基于生成对抗模仿学习的航空器进近规划方法,其特征在于,所述基于所述历史轨迹数据确定专家进近规划动作序列包括:
4.根据权利要求1所述的基于生成对抗模仿学习的航空器进近规划方法,其特征在于,所述基于所述历史飞行状态数据和专家进近规划动作序列训练进近规划模型包括:
5.根据权利要求4所述的基于生成对抗模仿学习的航空器进近规划方法,其特征在于,所述训练损失函数包括规划模块损失、评估模块判别任务损失、冲突探测任务损失和偏差预测任务损失,所述训练损失函数公式如下:
6.根据权利要...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。