一种基于深度强化学习的战斗机自动近地防撞系统碰撞评估方法技术方案

技术编号:24757064 阅读:37 留言:0更新日期:2020-07-04 09:21
本发明专利技术公开一种基于深度强化学习的战斗机自动近地防撞系统碰撞评估方法,在航空器飞行过程中,周期性预测航空器未来一段时间内的飞行轨迹;并生成对应区域内的地形包线。结合数字地形高程数据库,通过深度强化学习海量飞行数据及飞行员经验,来综合评估航空器撞地的风险。

A collision assessment method for Fighter automatic near earth collision avoidance system based on deep reinforcement learning

【技术实现步骤摘要】
一种基于深度强化学习的战斗机自动近地防撞系统碰撞评估方法
本专利技术涉及航空电子系统技术与人工智能
,尤其是航空器中广泛应用的近地告警类设备中涉及的一项近地碰撞评估技术,此类系统包括但不限于近地防撞系统、近地告警系统、地形提示与警告系统等具体产品。
技术介绍
近地防撞类系统(AutoGroundCollisionAvoidanceSystem,简称AutoGCAS)是提高航空器飞行安全性,减小可控飞行撞地事故(ControlledFlightIntoTerrain,简称CFIT)的航空电子系统。AutoGCAS系统广泛应用于战斗机、攻击机以及具有作战任务的无人机等航空器。AutoGCAS系统的核心技术之一是自动近地碰撞评估技术,结合数字地形高程数据库,通过深度强化学习海量飞行数据及飞行员经验,来综合评估航空器撞地的风险。
技术实现思路
本专利技术公开了一种基于深度强化学习的战斗机自动近地防撞系统碰撞评估方法,在航空器飞行过程中,周期性预测航空器未来一段时间内的飞行轨迹;并生成对应区域内的地形包线。结合数本文档来自技高网...

【技术保护点】
1.一种基于深度强化学习的战斗机自动近地防撞系统碰撞评估方法,其特征在于,包括以下步骤:/n步骤A:初始化近地防撞评估策略π;/n步骤B:设置随机状态S,包括飞行状态FS、预测飞行轨迹TPA、地形高程数据DEM、自动防撞指令GCAS;/n步骤C:根据步骤B的状态S,由近地防撞评估策略π选择出动作a,即过载指令曲线;并计算出值函数Q(s,a),发送至数据存储空间;/n步骤D:根据动作a,由飞行控制律计算出舵面指令De;/n步骤E:根据舵面指令De,由飞行仿真计算出飞行状态FS,包括位置、速度、姿态角及角速率、过载等;/n步骤F:根据飞行状态FS,自动近地防撞功能从数字地形高程数据库(方块104)...

【技术特征摘要】
1.一种基于深度强化学习的战斗机自动近地防撞系统碰撞评估方法,其特征在于,包括以下步骤:
步骤A:初始化近地防撞评估策略π;
步骤B:设置随机状态S,包括飞行状态FS、预测飞行轨迹TPA、地形高程数据DEM、自动防撞指令GCAS;
步骤C:根据步骤B的状态S,由近地防撞评估策略π选择出动作a,即过载指令曲线;并计算出值函数Q(s,a),发送至数据存储空间;
步骤D:根据动作a,由飞行控制律计算出舵面指令De;
步骤E:根据舵面指令De,由飞行仿真计算出飞行状态FS,包括位置、速度、姿态角及角速率、过载等;
步骤F:根据飞行状态FS,自动近地防撞功能从数字地形高程数据库(方块104)中获取相应区域的地形高程数据DEM;
步骤G:自动近地防撞功能,计算出自动防撞指令GCAS,并将此信号发送给飞行控制律;
步骤H:自动近地防撞功能,根据实际飞行轨迹与地形的匹配值,计算出回报r;
步骤I:自动近地防撞功能,将下一状态S,包括飞行状态FS、预测飞行轨迹TPA、地形高程数据DEM、自动防撞指令GCAS等信息,发送给近地防撞评估策略和数据存储空间;
步骤J:重复步骤C至步骤H,直至出现碰撞为止;
步骤K:学习训练数据更新,从数据存储空间中随机采样,每一个采样包括状态S、动作a、单步回报r、下一步状态S、策略π;
步骤L:近地防撞评估策略,从学习训练数据更新中,选取一个采样,包括状态S、动作a、单步回报r、下一步状态S、策略π;并计算出对应的值函数Qnew(s,a);
步骤M:近地防撞评估策略,从数据存储空间中获取对应状态-动作对(s,a)的值函数Q(s,a)
步骤N:近地防撞评估策略,通过梯度下降偏差,修正近地防撞评估策略(方块100)内的参数
步骤O:重复步骤L至步骤N,直至学习训练数据更新(方块106)中的样本选取完毕,即完成一轮的评估参数更新;
步骤P:重复步骤C至步骤O,直至将所有飞行数据学习,并将评估参数更新完毕为止。


2.如权利要求1所述的方法,其特征在于,所述步骤A中近地防撞评估策略π,是根据输入状态S(飞行状态FS、预测飞行轨迹TPA、地形高程数据DEM、自动防撞指令GCAS),计算出动作a(过载指令曲线)以及对应的值函数Q(s,a)。其中,值函数是反映了在状态S情况下,采用动作a,所获得的累积回报。


3.如权利要求1所述的方法,其特征在于,所述步骤B中设置随机状态S,包括飞行状态FS、预测飞行轨迹TPA、地形高程数据DEM、自动防撞指令GCAS。


4.如权利要求1所...

【专利技术属性】
技术研发人员:尹超孙萍夏小春刘爽王亚许
申请(专利权)人:上海航空电器有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1