基于改进的k-prototype和灰色关联分析的机场相似日选择方法技术

技术编号:36686586 阅读:54 留言:0更新日期:2023-02-27 19:50
本发明专利技术公开了一种基于改进的k

【技术实现步骤摘要】
基于改进的k

prototype和灰色关联分析的机场相似日选择方法


[0001]本专利技术属于大数据和机场相似日领域,具体涉及一种基于改进的k

prototype和灰色关联分析的机场相似日选择方法。

技术介绍

[0002]随着航空运输业的持续发展,空域资源的紧缺,机场运行效率也面临着极大的考验,而机场的效率很大程度上取决于管制人员的决策。但是管制员的决策主要依靠自己的经验和直觉,这不可避免的会造成不合理的流控措施。
[0003]由于天气的不确定性和日益增加的航班数量,使得机场的容量与需求不平衡问题变得严重,这不仅给航空公司、乘客和机场造成了经济损失,而且给管制系统提出了更高的要求与挑战。如何从过去的运行中获得经验,以支持当天的交通流控决策,从而帮助管制员更好地进行流量管理,这成为了本领域技术人员亟需解决的问题。因此,研究机场相似日可以帮助管制员从历史中吸取经验和教训,对提高流控工作效率和提高航班正常性具有重要意义。
[0004]针对传统研究所采用的聚类方式都是使用数值型指标寻找相似日集群,但是,在天气信息和航班运行数据中既有数值型特征也有分类型特征,所以直接用适用于处理数值型特征的聚类算法,得到的聚类结果会不准确。同时,之前研究并未找寻到与未知日相似的具体某一天,这就造成模型的实用价值不高。

技术实现思路

[0005]专利技术目的:本专利技术的目的是为了解决现有技术中存在的缺点,从而提出的一种基于改进的k

prototype和灰色关联分析的机场相似日选择方法,可以找寻未知日具体某天的相似日,展示了直观并且高准确率的相似日结果。
[0006]技术方案:本专利技术提供了一种基于改进的k

prototype和灰色关联分析的机场相似日选择方法,具体包括以下步骤:
[0007]S1:收集数据,包括METAR报文数据和航班运行数据;
[0008]S2:数据预处理,包括对航班数据补齐及数据归一化;
[0009]S3:使用CRITIC权重法得到数值属性的权重系数;
[0010]S4:通过改进的k

prototype对未知日和历史数据进行日属性聚类;
[0011]S5:使用误差平方和与轮廓系数曲线判断出最佳的聚类数;
[0012]S6:采用灰色关联分类法找寻未知日的相似日。
[0013]进一步地,步骤S1中所述航班运行数据包括实际进港航班数、实际离港航班数和计划进离港航班数。
[0014]进一步地,所述步骤S2包括以下步骤:
[0015]S2.1:解析METAR报,选择能见度,风向,风速,云底高,雾、雨和雷暴作为关键气象
因素;
[0016]S2.2:对风向、雾、雨和雷暴进行离散化处理;
[0017]S2.3:获取的数据有数值型和属性型,其中数值型有能见度、风速、云底高、实际进港航班数、实际离港航班数和计划进离港航班数;属性型有风向、雾、雨和雷暴;采用线性插值的方式进行补全数据,对于缺失整天起降信息的日期进行删除处理;
[0018]S2.4:将数值型数据归一化采用MinMax法,利用公式进行归一化后的数据值域变换到[0,1];其中,x为样本数据,x
min
为该属性所有样本的最小值,x
max
为该属性所有样本的最大值。
[0019]进一步地,所述步骤S3包括以下步骤:
[0020]S3.1:计算对比强度,计算公式为:
[0021][0022]其中,V
j
是第j项指标的变异系数,σ
j
是第j项的标准差,是第j项的平均数;
[0023]S3.2:计算相关系数:
[0024][0025]其中,x
hi
和x
hj
是第h个评价对象的第i个指标和第j个指标的值,和是n个对象中第i个指标和第j个指标的均值;
[0026]S3.3:计算第j个指标与其他指标冲突性量化指标值:
[0027][0028]其中,r
ij
为相关系数;
[0029]S3.4:计算指标信息量:各个指标的客观权重是以对比强度和冲突性来综合衡量的,计算公式为:
[0030][0031]其中,C
j
为第j个评价指标所包含的信息量;
[0032]S3.5:计算权重指标:
[0033][0034]其中,w
j
为权重指标。
[0035]进一步地,所述步骤S4包括以下步骤:
[0036]S4.1:数值属性指标之间采用欧式距离计算,计算公式为:
[0037][0038]其中,x
ijr
和y
ijr
为数值特征,w
ij
为不同数值评价指标的权重,P为数值特征个数;
[0039]S4.2:类别属性指标之间的采用汉明距离计算,即属性值相同为0,属性值不同为1计算公式为:
[0040][0041]其中,x
ijt
和y
ijt
为类别特征,P为类别特征个数;
[0042]S4.3:数据集和簇的相异度可以写为如下公式:
[0043]d(x
i
,y
i
)=d1+γd2[0044]因为γ难以确定所以对d(x
i
,y
i
)进行改写:
[0045][0046]式中,|A
r
|为数值型属性个数,|A
c
|为分类型属性个数和|A|总的属性个数;
[0047]S4.4:改进的k

prototype聚类是一个迭代过程,对比目标函数值是否改变,循环直到目标函数不再改变为止:
[0048][0049]其中,γ
li
∈{0,1},1≤l≤k,1≤i≤n;E为样本总的损失。
[0050]进一步地,所述步骤S5包括以下步骤:
[0051]S5.1:选取能见度,云底高,进离港航班等m个重要特征构建天气

交通矩阵,则第i日的日特征向量为:x
i
=[x
i1
,x
i2
,

,x
im
],i=1,2,

,N;
[0052]S5.2:数据进行无量纲化处理,得到灰色关联判断矩阵,未知日的特征向量x0,与其他日期属性的特征计算关联系数ρ
ik
,公式为:
[0053][0054]式中,ρ为分辨系数,ρ∈[0,1],其中ρ取0.5;
[0055]S5.3:得到每个样本的灰色关联值γ
i

[0056][0057]S5.4:依据灰色关联值,选择与未知日关联系数较大的日期组成相似日。
[0058本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进的k

prototype和灰色关联分析的机场相似日选择方法,其特征在于,包括以下步骤:S1:收集数据,包括METAR报文数据和航班运行数据;S2:数据预处理,包括对航班数据补齐及数据归一化;S3:使用CRITIC权重法得到数值属性的权重系数;S4:通过改进的k

prototype对未知日和历史数据进行日属性聚类;S5:使用误差平方和与轮廓系数曲线判断出最佳的聚类数;S6:采用灰色关联分类法找寻未知日的相似日。2.根据权利要求1所述的基于改进的k

prototype和灰色关联分析的机场相似日选择方法,其特征在于,步骤S1中所述航班运行数据包括实际进港航班数、实际离港航班数和计划进离港航班数。3.根据权利要求1所述的基于改进的k

prototype和灰色关联分析的机场相似日选择方法,其特征在于,所述步骤S2包括以下步骤:S2.1:解析METAR报,选择能见度,风向,风速,云底高,雾、雨和雷暴作为关键气象因素;S2.2:对风向、雾、雨和雷暴进行离散化处理;S2.3:获取的数据有数值型和属性型,其中数值型有能见度、风速、云底高、实际进港航班数、实际离港航班数和计划进离港航班数;属性型有风向、雾、雨和雷暴;采用线性插值的方式进行补全数据,对于缺失整天起降信息的日期进行删除处理;S2.4:将数值型数据归一化采用MinMax法,利用公式进行归一化后的数据值域变换到[0,1];其中,x为样本数据,x
min
为该属性所有样本的最小值,x
max
为该属性所有样本的最大值。4.根据权利要求1所述的基于改进的k

prototype和灰色关联分析的机场相似日选择方法,其特征在于,所述步骤S3包括以下步骤:S3.1:计算对比强度,计算公式为:其中,V
j
是第j项指标的变异系数,σ
j
是第j项的标准差,是第j项的平均数;S3.2:计算相关系数:其中,x
hi
和x
hj
是第h个评价对象的第i个指标和第j个指标的值,和是n个对象中第i个指标和第j个指标的均值;S3.3:计算第j个指标与其他指标冲突性量化指标值:
其中,r
ij
为相关系数;S3.4:计算指标信息量:各个指标的客观权重是以对比强度和冲突性来综合衡量的,计算公式为:其中,C
j
为第j个评价指标所包含的信息量;S3....

【专利技术属性】
技术研发人员:董襄宁祝许浩赵征
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1