一种基于强化学习的飞行特情任务训练质量提升方法及系统技术方案

技术编号:44162810 阅读:21 留言:0更新日期:2025-01-29 10:34
本发明专利技术公开了一种基于强化学习的飞行特情任务训练质量提升方法及系统,方法包括以下步骤:S1:基于目标飞机特情任务,构建飞行动力学模型、特情任务模型,建立强化学习环境。基于飞行安全操作要求建立奖励函数。S2:建立混合Actor‑Critic网络,并使用策略分离近端策略优化(Actor‑Separated Proximal Policy Optimization,ASPPO)算法训练特情处置决策网络,得到最优控制智能体。S3:基于最优控制智能体,生成多组动作序列集,并分析序列集中最大频繁动作序列,识别出操作动作偏时、动作多余、动作遗漏、动作错序的问题。

【技术实现步骤摘要】

本专利技术属于飞行安全和飞行训练领域,具体涉及一种基于强化学习的飞行特情任务训练质量提升方法及系统


技术介绍

1、恶劣天气、机械故障、飞行员严重操作失误导致的飞行特情在民航运输飞行过程中发生率极低,一旦出现则可能导致严重事故征候甚至飞行事故。对此,飞行员一般要在全任务飞行模拟机上进行复训、熟练检查等训练,以保持对飞行特情的处置能力。在模拟训练中,教员通过设置遭遇恶劣天气、机械故障等特情任务科目,着重考察飞行员的观察、反应、决断等技能。在目前的模拟机训练过程中,主要依靠教员对飞行员飞行过程的定性分析和经验讲解,缺少对操作动作的定量分析手段。如果飞行员对操作动作理解不够深入,则容易出现操作动作偏时、动作多余、动作遗漏、动作错序的问题。动作偏时是指飞行员未按照规定要求及时完成某项飞行操作环节,动作过早或过晚;动作多余是指飞行员未按照规定要求,执行了多余的动作;动作遗漏是指飞行员未按照规定要求,遗漏了必要的动作;动作错序是指飞行员未按照规定要求按照先后顺序执行动作。这些问题会降低飞行训练质量。在实际飞行过程中,错误的飞行操作可能导致飞机飞行状态超出包线、机载设备本文档来自技高网...

【技术保护点】

1.一种基于强化学习的飞行特情任务训练质量提升方法,其特征在于,包括以下步骤:

2.根据权利要求1的基于强化学习的飞行特情任务训练质量提升方法,其特征在于,S1中,基于目标飞机特情训练任务,构建强化学习环境的方法包括:

3.根据权利要求1的基于强化学习的飞行特情任务训练质量提升方法,其特征在于,S2中,建立的混合Actor-Critic网络,前三层网络为多层感知网络MLP,后续网络通过引入离散动作网络discrete-Actor与连续动作网络continuous-Actor两个分支,分别输出离散动作和连续动作,多层感知网络MLP通过全连接网络分别连接离散动作网络d...

【技术特征摘要】

1.一种基于强化学习的飞行特情任务训练质量提升方法,其特征在于,包括以下步骤:

2.根据权利要求1的基于强化学习的飞行特情任务训练质量提升方法,其特征在于,s1中,基于目标飞机特情训练任务,构建强化学习环境的方法包括:

3.根据权利要求1的基于强化学习的飞行特情任务训练质量提升方法,其特征在于,s2中,建立的混合actor-critic网络,前三层网络为多层感知网络mlp,后续网络通过引入离散动作网络discrete-actor与连续动作网络continuous-actor两个分支,分别输出离散动作和连续动作,多层感知网络mlp通过全连接网络分别连接离散动作网络discrete-actor和连续动作网络continuous-actor。

4.根据权利要求3的基于强化学习的飞行特情任务训练质量提升方法,其特征在于,s2...

【专利技术属性】
技术研发人员:高振兴张洋洋孔维武
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1