一种基于天气影响的离场航班延误分析及预测方法技术

技术编号:24171421 阅读:33 留言:0更新日期:2020-05-16 03:05
本发明专利技术公开了一种基于天气影响的离场航班延误分析及预测方法,包括如下步骤:对航班数据和天气数据进行预处理,并进行数据融合;将得到的融合后的数据进行特征分析和提取;构建基于天气因素的随机森林模型,将提取的特征作为随机森林模型的特征输入,将航班是否发生延误作为模型的训练目标,进行模型的训练,得到模型的预测精度,获取到航班延误预测的分类结果。本发明专利技术充分的考虑了气象数据的时间和空间特征,科学地评估天气对于机场离场航班运行的影响,且对于预测其他机场的航班延误具有同样的适用性,能够提高对于离场航班延误的预测精度。

An analysis and prediction method of departure flight delay based on weather influence

【技术实现步骤摘要】
一种基于天气影响的离场航班延误分析及预测方法
本专利技术属于大数据及机器学习领域,具体涉及一种基于天气影响的离场航班延误分析及预测方法。
技术介绍
近年来随着国民经济的飞速发展,不断增加的航空运输需求给我国的航空运输业带来了前所未有的机遇,同时也涌现出了一些制约机场和航空公司发展的问题。其中被业内外广泛关注的就是航班延误问题。在航班不正常原因中,天气因素占比高居不下。虽然现代航空器飞行的自动化水平不断提高,机载设备和地面保障设备亦日臻完善,航空器可以在大多复杂气象条件下运行。但是,天气因素仍然是导致不正常航班的主要因素,特别是在起飞和着陆阶段,恶劣天气对航班运行的影响很大,如低能见度、降雨、起风等都会使飞机起飞、着陆困难。由于恶劣天气的严重程度、持续时间以及发生区域的不确定性,某些重要机场出现的恶劣天气可能会导致全国出现区域性的航班延误。因此,研究机场天气和机场航班运行之间的关系对于缓解航班延误、促进航班安全快捷地运行具有重要意义。
技术实现思路
专利技术目的:为了克服现有技术中存在的不足,提供一种基于天气影响的离场航班延误分析及预测方法,其考虑了天气因素对于机场航班的运行影响,提高了对于航班延误的预测精度。技术方案:为实现上述目的,本专利技术提供一种基于天气影响的离场航班延误分析及预测方法,包括如下步骤:S1:对航班数据和天气数据进行预处理,并进行数据融合;S2:将步骤S1中得到的融合后的数据进行特征分析和提取;S3:构建基于天气因素的随机森林模型,将步骤S2提取的特征作为随机森林模型的特征输入,将航班是否发生延误作为模型的训练目标,进行模型的训练,得到模型的预测精度,获取到航班延误预测的分类结果。进一步的,所述步骤S1中经过预处理后的航班数据包括航班的执行时间、计划起飞时间、计划起飞机场、实际起飞时间、实际起飞机场、计划着陆时间、计划着陆机场、实际着陆时间、实际着陆机场、航空公司代码、起降机场之间的距离、航班是否延误一共12个属性。进一步的,所述步骤S1中对于天气数据的预处理的具体方法步骤如下:S1-1:解析METAR报,提取有关能见度、风、沉降、冻结及危险天气现象相关的天气组分;S1-2:分配严重程度代码,该代码是一个离散数字,给定的严重性代码用气象事实描述(例如温度,风速或诸如雨或雪的现象)定义情况的下限和上限。如最好天气状况的严重程度代码为1,最糟糕的天气情况对应的严重程度代码为4或5,每条METAR报中解析出的天气现象都会有一个与之对应的气象严重程度;S1-3:分配协同作用得分系数,其是一个离散的数字(从0到30),为给定严重性代码的严重性赋值,引入它是因为严重性代码本身不足以描述某些气象现象的非线性行为。例如,从中雪到大雪的转变对于机场运营来说比从中雨到大雨的转变要重要得多。进一步的,所述步骤S1中预处理后的天气数据包括观测机场、观测时间、能见度、风、沉降、冻结、危险现象、恶劣天气持续时间一共8个属性。进一步的,所述步骤S1中恶劣天气持续时间的具体计算方法为:确定恶劣天气临界值ws,统计不同天气得分s下,机场的累计离场航班延误场的恶劣天气临界值,即ws={s|max(p(s+1)-p(s)),s∈S},其中S为机场量化天气得分集合;确定恶劣天气的持续时间即天气得分在某一连续时段内持续大于等于恶劣天气临界值所对应的连续时段时间之和。进一步的,所述步骤S1中以航班的实际起飞/降落时间以及机场天气的观测时间这3个特征为键值,对历史航班数据和天气数据进行融合。进一步的,所述步骤S2中特征分析和提取的具体方法为:特征分析:主要着重分析天气的发生时间以及恶劣天气的持续时间、严重程度对离场航班运行的影响;特征提取:提取离场航班所处的时段、航班所处时段对应的恶劣天气所持续的时间、起降机场间的距离、起飞机场的气象要素评分及目的机场的气象要素评分的特征。进一步的,所述步骤S3具体为:将步骤S2提取的特征作为模型的输入,将航班是否发生离场延误作为模型的训练目标;使用合成少数类的过采样技术(SMOTE)对不平衡数据集进行处理;将构建模型的数据分两部分,一部分数据用于训练,另一部分数据用于测试预测模型的准确率,重复训练,得到模型的预测精度。本专利技术首先对该机场的离场航班数据进行预处理,计算该机场当前的离场航班延误;然后,采用空中交通管理机场性能天气算法(ATMAP算法)对机场的航空例行天气报告进行量化,分析恶劣天气的发生时间、严重程度以及持续时间对离场航班运行的影响;其次,提取有关天气方面的特征向量,构建基于天气因素的随机森林模型,对航班延误进行预测,得到航班延误预测的分类结果。有益效果:本专利技术与现有技术相比,充分的考虑了气象数据的时间和空间特征,科学地评估天气对于机场离场航班运行的影响,且对于预测其他机场的航班延误具有同样的适用性,能够提高对于离场航班延误的预测精度,改善航班运行状况,具备很好的应用价值。附图说明图1为本专利技术中延误预测模型的构建流程图;图2为不同天气对应的累计离场延误航班分布图;图3为不同天气对应的航班离场延误时长分布图;图4为不同天气得分在不同时段下的离场延误航班量分布图;图5为恶劣天气不同持续时间下的延误状况图;图6为100次随机森林模型的预测结果示意图;图7为随机森林模型的ROC曲线示意图。具体实施方式下面结合附图和具体实施例,进一步阐明本专利技术。本实施例中以上海浦东机场作为实例机场,利用本专利技术方法建立随机森林模型进行离场航班延误分析及预测,参照图1,其具体步骤如下:S1:数据处理:对上海浦东机场的历史航班数据进行预处理:将预处理后的航班数据集定义为F,包括航班的执行时间、计划起飞时间、计划起飞机场、实际起飞时间、实际起飞机场、计划着陆时间、计划着陆机场、实际着陆时间、实际着陆机场、航空公司代码、起降机场之间的距离、航班是否延误一共12个属性;对历史天气数据进行预处理:首先对天气数据进行筛选,将筛选后的天气数据集定义为W,包括观测机场、观测时间、能见度、风、沉降、冻结、危险现象、恶劣天气持续时间一共8个属性;然后对天气数据集W进行量化处理,量化方法为空中交通管理机场性能天气算法(ATMAP算法),具体量化过程为:A)解析METAR报,提取有关能见度、风、沉降、冻结及危险天气现象相关的天气组分;B)分配严重程度代码,该代码是一个离散数字,给定的严重性代码用气象事实描述(例如温度,风速或诸如雨或雪的现象)定义情况的下限和上限,将最好天气状况的严重程度代码为1,最糟糕的天气情况对应的严重程度代码为5,每条METAR报中解析出的天气现象都会有一个与之对应的气象严重程度;C)分配协同作用得分系数,其是一个离散的数字(从0到30),为给定严重性代码的严重性赋值,引入它是因为严重性代码本身不足以描述某些气象现本文档来自技高网...

【技术保护点】
1.一种基于天气影响的离场航班延误分析及预测方法,其特征在于:包括如下步骤:/nS1:对航班数据和天气数据进行预处理,并进行数据融合;/nS2:将步骤S1中得到的融合后的数据进行特征分析和提取;/nS3:构建基于天气因素的随机森林模型,将步骤S2提取的特征作为随机森林模型的特征输入,将航班是否发生延误作为模型的训练目标,进行模型的训练,得到模型的预测精度,获取到航班延误预测的分类结果。/n

【技术特征摘要】
1.一种基于天气影响的离场航班延误分析及预测方法,其特征在于:包括如下步骤:
S1:对航班数据和天气数据进行预处理,并进行数据融合;
S2:将步骤S1中得到的融合后的数据进行特征分析和提取;
S3:构建基于天气因素的随机森林模型,将步骤S2提取的特征作为随机森林模型的特征输入,将航班是否发生延误作为模型的训练目标,进行模型的训练,得到模型的预测精度,获取到航班延误预测的分类结果。


2.根据权利要求1所述的一种基于天气影响的离场航班延误分析及预测方法,其特征在于:所述步骤S1中经过预处理后的航班数据包括航班的执行时间、计划起飞时间、计划起飞机场、实际起飞时间、实际起飞机场、计划着陆时间、计划着陆机场、实际着陆时间、实际着陆机场、航空公司代码、起降机场之间的距离、航班是否延误一共12个属性。


3.根据权利要求1所述的一种基于天气影响的离场航班延误分析及预测方法,其特征在于:所述步骤S1中对于天气数据的预处理的具体方法步骤如下:
S1-1:解析METAR报,提取有关能见度、风、沉降、冻结及危险天气现象相关的天气组分;
S1-2:分配严重程度代码,每条METAR报中解析出的天气现象都会有一个与之对应的气象严重程度;
S1-3:分配协同作用得分系数,为给定严重性代码的严重性赋值。


4.根据权利要求1或3所述的一种基于天气影响的离场航班延误分析及预测方法,其特征在于:所述步骤S1中预处理后的天气数据包括观测机场、观测时间、能见度、风、沉降、冻结、危险现象、恶劣天气持续时间一共8个属性。

【专利技术属性】
技术研发人员:王艳军刘彤丹王丽伟胡明华
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1