System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种机场场面滑行路径生成方法、电子设备和存储介质技术_技高网

一种机场场面滑行路径生成方法、电子设备和存储介质技术

技术编号:41287865 阅读:5 留言:0更新日期:2024-05-11 09:36
本发明专利技术涉及人工智能领域,提供一种机场场面滑行路径生成方法、电子设备和存储介质,包括:基于图结构对机场场面跑滑环境进行数字建模,构建了航空器滑行路径自动生成的马尔科夫决策过程,根据滑行路径的特点设计了奖励函数,以及基于机场场面滑行规则和滑行约束条件选择可执行动作,并结合深度强化学习自动获取滑行路径,从而能够更准确更高效的引导航空器滑行至目标位置。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,特别是涉及一种机场场面滑行路径生成方法、电子设备和存储介质


技术介绍

1、近年来,随着全球航空运输量的稳步增长,航空器起降架次日益增多,机场日趋繁忙,多数枢纽机场场面运行接近或达到容量饱和状态,存在跑道、滑行道等资源不足问题,机场飞行区环境动态变化,业务规则繁多,滑行路径规划具有高度的不确定性和复杂性,航空器滑行路径智能规划有助于减少动态环境运行冲突,提高场面运行效率。机场场面滑行路径规划是指根据进/离港需求,给定航空器初始位置和目标位置,为航空器生成一条满足机场场面滑行规则的无冲突的理想滑行路径,以优化滑行运行效率。现行滑行路径规划任务包括两大类:静态滑行路径规划和动态滑行路径规划。静态滑行路径规划是指在已知场面全部环境信息情况下的全局最优路径规划,常用方法包括dijkstra、等经典算法。静态路径规划无法适应机场运行场面环境的实时变化,不能解决动态滑行过程中的局部冲突问题。动态滑行路径规划是指在已知场面局部环境信息情况下,根据当前已知信息和航空器自身状态,为航空器实时规划并动态调整最优路径。动态滑行路径规划方法借助规则或信息来指导搜索过程,能够在实时变化的环境中及时调整路径,解决局部冲突问题。然而当面对繁忙机场复杂动态运行环境时,存在时间复杂度高、易陷入局部最优并依赖已知地图信息和预定义规则等问题。


技术实现思路

1、针对上述技术问题,本专利技术采用的技术方案为:

2、根据本专利技术第一方面,提供了一种航空器滑行路径获取方法,所述方法包括如下步骤:

3、s100,构建机场场面跑滑环境的网格结构图g以及构建结构相同的训练q网络和目标q网络;其中,g=(v,e,w),v为节点集合,v={v1,v2,……,vi,……,vn},vi为v中的第i个节点,i的取值为1到m,m为v中的节点数量,节点为机场场面跑滑环境中的交叉路口;e为路段集合,e={e1,e2,……,ej,……,em},ej为e中的第j个路段,j的取值为1到m,m为e中的路段数量;w为路段权重值集合,w={w1,w2,……,wj,……,wm},wj为ej的路段权重值;其中,训练q网络的参数实时更新,目标q网络的参数按照设定更新周期q进行更新。

4、s200,基于所述机场场面跑滑环境中的航空器的历史滑行数据生成历史四元组信息集,以及基于所述训练q网络获取每个历史四元组信息的优先级,作为初始样本数据集并存放至经验回放区;第g个初始样本数据包括(sg,ag,rg,snextg,pg),sg为第g个初始样本数据对应的当前节点所处状态,ag为第g个初始样本数据对应的当前节点选择的动作,rg为第g个初始样本数据对应的当前节点选择动作ag后得到的即时奖励,snextg为第g个初始样本数据对应的当前节点选择动作ag后进入的下一节点所处状态的状态信息,pg为第g个初始样本数据的优先级;g的取值为1到n,n为初始样本数据的数量;其中,经验回放区的数据按照优先级由高到低的顺序排序;样本数据的优先级基于对应的时序差误差和即时奖励确定;所述即时奖励包括目标奖励、避障奖励和探索奖励。

5、s300,基于g生成n个路径信息;第h个路径信息包括(sph,eph),sph为第h个路径信息对应的起始节点,eph为第h个信息对应的结束节点,h的取值为1到n。

6、s400,设置迭代次数计数器c=1。

7、s500,设置航空器从sph滑行至epc,航空器基于ε贪婪策略选择当前状态sc对应的动作ac,并执行该动作,得到对应的即时奖励rc和新的状态snextc,得到对应的四元组信息(sc,ac,rc,snextc),并获取四元组信息(sc,ac,rc,snextc)的优先级pc,得到对应的五元组信息(sc,ac,rc,snextc,pc)并存放至当前的经验回放区中。

8、s600,从当前的经验回放区中利用优先经验回放方法采样预设数量的四元组信息,作为训练样本数据,将每个训练样本数据中的下一节点所处状态snext输入至当前训练q网络中,得到对应的最优动作amin;以及将每个四元组信息中的当前节点所处状态s和对应的动作a输入至当前训练q网络中,得到对应的第一q值q1,以及将每个四元组信息对应的snext和amin输入至当前目标q网络中,得到对应的第二q值q2;其中,训练q网络和目标q网络选择根据机场场面的滑行规则和滑行约束条件选择动作。

9、s700,基于q1和q2,利用梯度下降方式更新当前训练q网络的参数;如果(c/q)为整数,利用当前训练q网络的参数更新当前目标q网络的参数,并执行s800。

10、s800,如果snextc不是终止状态,控制航空器进入snextc,执行s500;否则,获取航空器对应的总奖励rc=rscg+rsca+rsce+rcn,并执行s900;rscg为该航空器对应的总目标奖励,rsca为该航空器对应的总避障奖励,rsce为该航空器对应的总探索奖励,rcn为该航空器对应的内在奖励;所述内在奖励随着迭代次数的增加而减少。

11、s900,设置c=c+1,如果c≤n,执行s500;如果c>n,如果c个总奖励中的最小奖励的数量a≥p0,退出当前控制程序,将当前训练q网络作为最终的预测网络,如果a<p0,更新n,执行s500;p0为预设数量阈值。

12、根据本专利技术第二方面,提供一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行本专利技术第一方面所述的方法。

13、根据本专利技术第三方面,提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机指令用于执行本专利技术第一方面所述的方法。

14、本专利技术至少具有以下有益效果:

15、本专利技术实施例提供的机场场面滑行路径生成方法,能够基于航空器的当前位置信息自动生成符合机场场面滑行规则和滑行约束条件的最优滑行路径信息。

16、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种航空器滑行路径获取方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,Pg=rnextg+γQ(snextg,anextg)-Q(sg,ag)+wgrg+ε;其中,Q(snext-1g,anextg)为将snext-1g和anextg输入当前训练Q网络得到的Q值,snext-1g为当前训练Q网络基于sg得到的新状态,anextg为snext-1g所选择的动作,Q(sg,ag)为将sg和ag输入当前训练Q网络得到的Q值,rnextg为snext-1g选择anextg后得到的即时奖励,γ为折扣因子,wg为rg对应的权重,ε为设定正数。

3.根据权利要求1所述的方法,其特征在于,目标奖励满足如下条件:如果航空器到达目标位置,目标奖励等于第一设定奖励d1,否则,目标奖励等于0;避障奖励满足如下条件:如果航空器通过不可行区域,避障奖励等于第二设定奖励d2,如果航空器通过可行区域,避障奖励等于0;探索奖励为当前状态和下一状态对应节点之间的路段权重值,d1<0,d2>0。

4.根据权利要求1所述的方法,其特征在于,rc4=k×e-α×c,k为设定内在奖励初始值,α为衰减速率参数。

5.根据权利要求1所述的方法,其特征在于,Q值包括状态值和优势值。

6.根据权利要求1所述的方法,其特征在于,还包括如下步骤:

7.一种电子设备,其特征在于,包括处理器和存储器;

8.一种非瞬时性计算机可读存储介质,其特征在于,所述非瞬时性计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如权利要求1至6任一项所述方法的步骤。

...

【技术特征摘要】

1.一种航空器滑行路径获取方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,pg=rnextg+γq(snextg,anextg)-q(sg,ag)+wgrg+ε;其中,q(snext-1g,anextg)为将snext-1g和anextg输入当前训练q网络得到的q值,snext-1g为当前训练q网络基于sg得到的新状态,anextg为snext-1g所选择的动作,q(sg,ag)为将sg和ag输入当前训练q网络得到的q值,rnextg为snext-1g选择anextg后得到的即时奖励,γ为折扣因子,wg为rg对应的权重,ε为设定正数。

3.根据权利要求1所述的方法,其特征在于,目标奖励满足如下条件:如果航空器到达目标位置,目标奖励等于第一设定奖励d1,否...

【专利技术属性】
技术研发人员:冯霞丁仙妃左海超卢敏吕宗磊
申请(专利权)人:中国民航大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1