当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于时空图卷积神经网络的多机场航班延误预测方法技术

技术编号:39056659 阅读:15 留言:0更新日期:2023-10-12 19:49
本发明专利技术公开了一种基于时空图卷积神经网络的多机场航班延误预测方法。本发明专利技术中,提出了一种基于时空图卷积神经网络的多机场延误预测方法。该方法使用有向图来表达了多机场网络,使用机场延误来作为多机场网络邻接矩阵的权重,利用GCN神经网络模型可以直接作用于图结构,并且能充分提取图结构信息的特点,来提取多机场网络中的空间信息特征,利用GRU神经网络模型良好的时序捕捉能力,来提取多机场网络中的时间信息特征,两者相结合,构建一个多机场网络延误预测模型MADPNet,结合GRU神经网络模型,建立多机场航班延误预测模型,并实现多时间步预测。此方法可以有效地提取网络级机场延误在时间维度上的变化趋势。场延误在时间维度上的变化趋势。场延误在时间维度上的变化趋势。

【技术实现步骤摘要】
一种基于时空图卷积神经网络的多机场航班延误预测方法


[0001]本专利技术属于航班延误预测领域,具体为一种基于时空图卷积神经网络的多机场航班延误预测方法。

技术介绍

[0002]随着全球经济的不断发展,乘坐飞机出行逐渐成为一种普遍的选择。但由于气象等因素的影响,机场航班常常出现各种延误的问题。这对于航空公司和旅客们,都产生了较大的负面影响。航班延误,不仅会增加旅客住宿、餐饮等额外支出,而且会影响旅客的行程安排,导致错过重要的商务会议或其他紧急事务。而对于航空公司而言,频繁的航班延误不仅需要承担延误所带来的额外成本,例如员工工资、旅客赔偿等费用,而且还会对品牌形象带来负面影响。为此,良好的航班延误预测方法,可为航空公司及时调整航班调度策略,减少不必要的成本和资源浪费,也可为旅客合理规划个人行程,减少一些不必要的机场等待时间。
[0003]在预测机场航班延误的问题上,常用的一些方法:(1)历史数据分析法,此方法主要是收集过去一段时间的航班延误数据,对数据进行统计分析,计算各种指标,绘制图表等,以此来找到数据中的规律和趋势,从而预测未来可能发生的航班延误情况。这种方法执行起来简单易行,不需要复杂的计算和深厚的专业知识,直观地从大量数据中寻找规律和趋势,预测结果具有较好的可解释性。但缺点是使用静态数据,不能有效应对突发事件,如极端天气、突发故障等。(2)机器学习方法,此方法利用计算机对大量数据进行自动学习和分析,从而发现数据中的规律和关联。通过将历史航班延误数据、天气数据、航班计划数据等作为输入,机器学习模型可以预测未来的航班延误情况。目前已有的一些机器学习方法,例如支持向量机(SVM)模型,探讨了航班延误与各个关键因素之间的非线性关系;梯度提升决策树模型,通过结合基于机器学习范例的回归模型,对空中交通延误的模式进行详细分析;还有逻辑回归方法以及CART、KNN、GBM、XGB、LGBM机器学习模型等,这些传统的机器学习方法,在航班延误预测上取得了一定效。
[0004]但这些方法的泛化性能相对较差,并且都没有考虑到多机场网络的时空动态性和随机性,没有充分挖掘多机场网络的空间特征信息。

技术实现思路

[0005]本专利技术的目的在于:为了解决上述提出的问题,提供一种基于时空图卷积神经网络的多机场航班延误预测方法。
[0006]本专利技术采用的技术方案如下:一种基于时空图卷积神经网络的多机场航班延误预测方法,所述基于时空图卷积神经网络的多机场航班延误预测方法包括以下步骤:
[0007]S1:先进行数据采集及处理,
[0008]S2:进行多机场网络构建,根据航班历史数据,构建以机场为节点的机场间通航矩阵。如果两个机场间存在通航,则把矩阵中对应位置设为1,若不存在通航,则把矩阵对应位
置设为0。这是最基本的矩阵构建,为了更加准确地描述多个机场之间的通航情况,应该考虑边的权重,边也就代表了机场与机场之间的关系。并且两个机场之间的往返航班数量、产生的延误并不是对等的,这在图结构中,可以认为多机场网络图并非是一个无向图,而是有向图。例如,在2017年8月,ZSSS到ZBAA的航班总量为1236,而ZBAA到ZSSS的航班总量为1052。两个机场之间的航班进港数量和航班出港数量是不同的,这就表明本例中的多机场网络是一种有向图结构
[0009]S3:进行特征筛选,针对多机场延误预测,在气象数据中,主要筛选温度、风向、风速、能见度、反射率、露点这几个关键的信息来作为气象数据特征
[0010]S4:进行模型的构建,建立多机场延误预测模型
[0011]针对多机场航班延误预测所具有的时空相关特性,将GCN与GRU结合构建多机场航班延误预测模型,其核心计公式如下所示:
[0012]r
t
=σ(W
r
[f(x
t
,A),h
t
‑1]+b
r
) (10)
[0013]z
t
=σ(W
z
[f(x
t
,A),h
t
‑1]+b
z
) (11)
[0014]c
t
=tanh(W
c
[f(x
t
,A),r
t
*h
t
‑1]+b
c
) (12)
[0015]h
t
=(1

z
t
)*h
t
‑1+z
t
*c
t (13)
[0016]最终构造出的预测模型如图3所示。
[0017]S5:模型输出长度的时间步,输出时间跨度的结果,之后即可结束整个预测过程。
[0018]在一优选的实施方式中,所述步骤S1中,对于机场航班历史数据,选取了2017年全国各大机场的真实航班数据;
[0019]对于机场航班气象数据,本方案从航空例行天气报告(Meteorological Terminal Aviation Routine Weather Report,METAR)中提取所需的气象数据。通常,机场或者气象观测站每隔半小时或一小时会生成一个METAR,METAR是一种观测气象数据传输格式,通过世界气象组织的规范以后,成为了世界各国气象数据的常用气象数据传输格式。
[0020]在一优选的实施方式中,所述步骤S1中,对于缺失与异常数据处理:采取的方式是直接删除含有缺失值的记录,对于个别数据的缺失,采用填充法,通过特定值、平均值、中位数或者众数的方式来完成填充。对于异常数据的检测,采用MAD方法,这是一种基于中位数的异常检测方法。
[0021]在一优选的实施方式中,所述步骤S1中,将原始数据保存于MySQL数据库中,利用MySQL中的聚集函数,筛选出各个机场的不同时间段的航班信息,利用数据库表操作,计算出各个机场在同一时间段内的延误。
[0022]在一优选的实施方式中,所述步骤S2中,构建多机场网络,不仅要从有向图的角度出发,而且要考虑到边的权重问题。边的权重,我们可以通过计算两个机场之间,在某一段时间内的延误总时间,以此来作为矩阵中对应边的权值,并使用均值归一化方法,让每个权值都集中在较小的尺度和范围当中,这有利于后续的多机场延误预测模型的训练,最终完成对多机场网络邻接矩阵的构建,如图2所示。
[0023]在一优选的实施方式中,所述步骤S3中,气象数据和机场航班历史数据对于多机场延误预测模型的预测效果而言是至关重要的。其中,气象数据主要从METAR报文中提取,此报文中主要包括了机场代码、温度、风力、具体天气等气象信息,在航空运输当中,天气对于延误的影响是十分明显的,天气和机场延误之间存在强相关性,特别是METAR报文中所包
含的风力、能见度等信息。
[0024]在一优选的实施方式中,所述步骤S4中,使用损失函数:
[0025][0026]使用MSE(M本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时空图卷积神经网络的多机场航班延误预测方法,其特征在于:所述基于时空图卷积神经网络的多机场航班延误预测方法包括以下步骤:S1:先进行数据采集及处理,S2:进行多机场网络构建,根据航班历史数据,构建以机场为节点的机场间通航矩阵;如果两个机场间存在通航,则把矩阵中对应位置设为1,若不存在通航,则把矩阵对应位置设为0;这是最基本的矩阵构建,为了更加准确地描述多个机场之间的通航情况,应该考虑边的权重,边也就代表了机场与机场之间的关系;并且两个机场之间的往返航班数量、产生的延误并不是对等的,这在图结构中,可以认为多机场网络图并非是一个无向图,而是有向图;例如,在2017年8月,ZSSS到ZBAA的航班总量为1236,而ZBAA到ZSSS的航班总量为1052;两个机场之间的航班进港数量和航班出港数量是不同的,这就表明本例中的多机场网络是一种有向图结构S3:进行特征筛选,针对多机场延误预测,在气象数据中,主要筛选温度、风向、风速、能见度、反射率、露点这几个关键的信息来作为气象数据特征S4:进行模型的构建,建立多机场延误预测模型针对多机场航班延误预测所具有的时空相关特性,将GCN与GRU结合构建多机场航班延误预测模型,其核心计公式如下所示:r
t
=σ(W
r
[f(x
t
,A),h
t
‑1]+b
r
)
ꢀꢀ
(10)z
t
=σ(W
z
[f(x
t
,A),h
t
‑1]+b
z
)
ꢀꢀ
(11)c
t
=tanh(W
c
[f(x
t
,A),r
t
*h
t
‑1]+b
c
)
ꢀꢀ
(12)h
t
=(1

z
t
)*h
t
‑1+z
t
*c
t
ꢀꢀ
(13)最终构造出的预测模型;S5:模型输出长度的时间步,输出时间跨度的结果,之后即可结束整个预测过程。2.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法,其特征在于:所述步骤S1中,对于机场航班历史数据,选取了2017年全国各大机场的真实航班数据;对于机场航班气象数据,本方案从航空例行天气报告(Meteorological Terminal Aviation Routine Weather Report,METAR)中提取所需的气象数据;通常,机场或者气象观测站每隔半小时或一小时会生成一个METAR,METAR是一种观测气象数据传输格式,通过世界气象组织的规范以后,成为了世界各国气象数据的常用气象数据传输格式。3.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法,其特征在于:所述步骤S1中,对于缺失与异常数据处理:采取的方式是直接删除含有缺失值的记录,对于个别数据的缺失,采用填充法,通过特定值、平均值、中位数或者众数的方式来完成填充;对于异常数据的检测,采用MAD方法,这是一种基于中位数的异常检测方法。4.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法,其特征在于:所述步骤S1中,将原始数据保存于MySQL数据库中,利用MySQL中的聚集函数,筛选出各个机场的不同时间段的航班信息,利用数据库表操作,计算出各个机场在同一时间段内的延误。5.如权利要求1所述的一种基于时空图卷积神经网络的多机场航班延误预测方法,其特征在于:所述步骤S2中,构建多机场网络,不仅要从有向图的角度出发,而且要考虑到边
的权重问题;边的权重,我们可以通过计算两个机场之间,在某一段时间内的延误总时间,以此来作为矩阵中对应边的权值,并使用均值归一化方法,让每...

【专利技术属性】
技术研发人员:刘健波张浩
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1