一种基于邻域粗糙集属性约简的空气质量数据处理方法技术

技术编号:37249583 阅读:18 留言:0更新日期:2023-04-20 23:28
本发明专利技术属于空气质量数据处理领域,具体涉及一种基于邻域粗糙集属性约简的空气质量数据处理方法。所述方法包括获取具有多个空气属性的空气质量样本数据,对各个空气属性进行排列组合;利用邻域粗糙集的依赖度和引入沙普利值的计算,计算出各个空气属性的重要程度,然后根据空气属性的重要程度构造出一个加权邻域粗糙集,重新定义加权邻域上下近似关系,接着定义新的依赖度,最后根据新的依赖度计算出大于设定的重要度下限的约简属性子集;优化空气质量数据。本发明专利技术可以解决现有的空气质量数据处理过程中空气属性权重一致的问题,通过邻域粗糙集的加权计算得到的空气属性,弥补邻域粗糙集模型的不足。粗糙集模型的不足。粗糙集模型的不足。

【技术实现步骤摘要】
一种基于邻域粗糙集属性约简的空气质量数据处理方法


[0001]本专利技术属于空气质量数据处理领域,具体涉及一种基于邻域粗糙集属性约简的空气质量数据处理方法。

技术介绍

[0002]随着传感器技术的发展,人们可以更全面地从多角度表征事物,衍生出大量复杂的高维数据集,而空气质量数据集就属于其中一种。对空气质量数据的分类问题也存在于实际生活中,能够根据各维度的数据特征快速识别空气质量的好坏,因此产生了对高维数据进行分类的需求。由于高维数据中存在大量的冗余信息,这给空气质量数据的分类带来了“维数灾难”问题,数据中的冗余属性会混淆学习算法,会增加过拟合的风险。因此解决空气质量数据中冗余属性的问题是必要的。
[0003]空气质量数据在如今大数据的环境下具有相当大的价值,其主要来自地面监测、气象卫星等采集站点。鉴于空气质量对人们生活的重要性,许多学者在利用机器学习方法对空气质量数据进行处理,如对空气污染物浓度变化趋势的预测研究、对空气质量等级的分类预测研究等。在现有的一些对于空气质量数据处理中,例如田等人利用基于VAE的内联关系进行特征提取和聚类,以本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于邻域粗糙集属性约简的空气质量数据处理方法,其特征在于,所述方法包括:获取具有多个空气属性的空气质量样本数据,对各个空气属性进行排列组合,并计算出各个空气属性子集的依赖度;采用沙普利值评估各个空气属性的重要程度,根据各个空气属性的重要程度构建出加权粗糙集,并确定出加权邻域相似关系;根据加权邻域相似关系定义加权邻域相似类,得到相似类的下近似定义;根据下近似定义得出分类决策的正域;根据加权邻域相似关系和分类决策的正域,得到分类决策对于空气属性子集的加权依赖度;使用以核为启发起点的基于正逼近的方法寻找约简的空气属性子集,输出优化后的空气质量数据。2.根据权利要求1所述的一种基于邻域粗糙集属性约简的空气质量数据处理方法,其特征在于,所述空气属性包括PM2.5、PM10、SO2、CO、NO2、O3、颗粒物中任意多种。3.根据权利要求1所述的一种基于邻域粗糙集属性约简的空气质量数据处理方法,其特征在于,所述采用沙普利值评估各个空气属性的重要程度包括:其中,ω(a
i
)表示空气属性a
i
的重要程度;|
·
|表示空气属性集合的基数;S表示不含有空气属性a
i
的空气属性子集且不为空集,|S|表示为空气属性集合S中元素的个数;P表示包含空气属性a
i
的所有空气属性子集形成的集合;表示空气属性子集S在加入空气属性a
i
后相对于决策属性D的依赖度;表示空气属性子集S相对于决策属性D的依赖度。4.根据权利要求1所述的一种基于邻域粗糙集属性约简的空气质量数据处理方法,其特征在于,所述根据各个空气属性的重要程度构建出加权粗糙集,并确定出加权邻域相似关系包括若空气质量样本x与空气质量样本y之间加权欧式距离小于邻域阈值,则所述空气质量样本x与所述空气质量样本y属于加权邻域相似关系,否则就不属于加权邻域相似关系。5.根据权利要求4所述的一种基于邻域粗糙集属性约简的空气质量数据处理方法,其特征在于,所述加权欧式距离表示为:其中,ω(a
i
)≥0,ω(a
i
)是空气属性a
i
的权重,f(x,a
i
)表示空气质量样本x在空气属性a
i
下的取值,δ表示邻域阈值;当ω(a
i
)>1时,在计算关系时,空气属性a
i
的重要性将增加;当0<ω(a
i
)&...

【专利技术属性】
技术研发人员:张晓霞邹兴宇
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1