融合深度强化学习和遗传算法的短程支线航班调度方法技术

技术编号:33372901 阅读:62 留言:0更新日期:2022-05-11 22:39
本发明专利技术公开了融合深度强化学习和遗传算法的短程支线航班调度方法,DRL模块利用编码器提取数据在高维空间的特征表达,解码器则根据规则和概率选择路径,最后使用强化学习的训练方法更新参数;训练并迭代了足够多次网络参数后,测试数据能通过网络计算得到一系列强大的“初始解”将“初始解”所组成的“种群”将作为输入传入遗传算法得到最终解。本发明专利技术有益效果:本发明专利技术深度强化学习完成了从问题输入到问题输出的端到端的求解方案,具有良好的泛化性;局部搜索容易陷入局部最优陷阱,依靠DRL提供的好的初始种群可以辅助搜索过程跳出“局优”;对于一定规模的问题,神经网络只需一次预训练,求解时响应速度快,提高搜索效率,减少搜索空间和时间。索空间和时间。索空间和时间。

【技术实现步骤摘要】
融合深度强化学习和遗传算法的短程支线航班调度方法


[0001]本专利技术涉及航班调度
,尤其是融合深度强化学习和遗传算法的短程支线航班调度方法。

技术介绍

[0002]随着车辆、飞机数量不断攀升、交通大数据平台建设的日益深化,机场规模愈来愈大,种类愈发繁多、调度系统日趋复杂。近年来借助智能算法进行资源调度和路径优化的需求既多且杂,因此机场、出行公司、物流企业对高度信息化需求越发迫切;以某境外群岛旅游胜地水上飞机接泊业务为例,乘客数量愈来愈多,飞机等硬件设施容量已几近饱和;企业仍利用人工的方式去安排路线和分配飞机。
[0003]因此,对于上述问题有必要提出融合深度强化学习和遗传算法的短程支线航班调度方法。

技术实现思路

[0004]针对上述现有技术中存在的不足,本专利技术的目的在于提供了融合深度强化学习和遗传算法的短程支线航班调度方法,以解决上述问题。
[0005]融合深度强化学习和遗传算法的短程支线航班调度方法,其方法步骤为:
[0006]DRL模块:DRL模块利用编码器提取数据在高维空间的特征表达本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.融合深度强化学习和遗传算法的短程支线航班调度方法,其特征在于:其方法步骤为:DRL模块:DRL模块利用编码器提取数据在高维空间的特征表达,解码器则根据规则和概率选择路径,最后使用强化学习的训练方法更新参数;局部搜索模块:训练并迭代了足够多次网络参数后,测试数据能通过网络计算得到一系列强大的“初始解”将“初始解”所组成的“种群”将作为输入传入遗传算法得到最终解。2.如权利要求1所述的融合深度强化学习和遗传算法的短程支线航班调度方法,其特征在于:所述DRL模块包括编码器、解码器和基于贪心策略训练DRL模块。3.如权利要求2所述的融合深度强化学习和遗传算法的短程支线航班调度方法,其特征在于:所述编码器的映射状态步骤为:(1)初始化节点嵌入;(2)注意力机制计算,将注意力机制视为一个寻址的过程,其计算过程为:信息的输入;其次是算出注意力分布α;最后是通过α计算输入信息的加权平均值;(3)批标准化处理基于上述步骤的编码器神经网络,使用批标准化方法,用mini

batch来训练网络;(4)前馈神经网络,利用一个全连接的前馈网络进一步提高网络的表达能力。4.如权利要求2所述的融合深度强化学习和遗传算法的短程支线航班调度方法,其特征在于:所述解码器的设计步骤为:计算上下文嵌入和计算对数概率。5.如权利要求2所述的融合深度强化学习和遗传算法的短程支线航班调度方法,其特征在于:其中基于贪心策略训练DRL模块的训练方...

【专利技术属性】
技术研发人员:巴继东涂来黄莹黄琛胡志华
申请(专利权)人:武汉长江通信智联技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1