一种基于粗糙集和结构风险最小化的空气质量预测方法技术

技术编号:35952222 阅读:14 留言:0更新日期:2022-12-14 10:45
本发明专利技术涉及一种基于粗糙集和结构风险最小化的空气质量预测方法,包括:获取与空气质量相关的环境参数样本数据;建立空气质量评价体系对从气象监测站点获取的环境参数样本数据进行等级评价创建空气质量指数决策表;根据空气质量指数决策表利用粗糙集理论和结构风险最小化理论计算条件属性子集的经验误差和条件属性子集与决策属性的互信息;并利用遗传算法计算得出最优条件属性子集,将最优条件属性子集中的条件属性作为粗糙集分类器的条件属性以目标监测点的环境参数数据对空气质量进行预测,本发明专利技术通过粗糙集理论结合结构风险最小化的预测模型,在不降低预测精确度的前提下,同时兼顾模型的复杂性,增强了预测的稳定性和鲁棒性。性和鲁棒性。性和鲁棒性。

【技术实现步骤摘要】
一种基于粗糙集和结构风险最小化的空气质量预测方法


[0001]本专利技术涉及空气质量预测领域,具体涉及一种基于粗糙集和结构风险最小化的空气质量预测方法。

技术介绍

[0002]环境污染问题目前已经在社会上引起了强烈的反应,这是因为严重的空气污染问题对人们的健康和寿命造成了影响,组成空气质量指数的主要污染物有PM2.5、PM10、S02、NO2、CO、O3、TSP(悬浮颗粒物)、DF(降尘)等八项,而AQI(Air Quality Index,空气质量指数)可能与一个或多个污染物因素相关联。
[0003]在现实生活中,主要污染物的数据是组成AQI的关键,然而由于污染物的数据获取存在误差,污染物数据可能不完整或者冗余,将会增大空气质量分析和预测的工作难度。
[0004]粗糙集理论是Z.Pawlak于1982年提出的一种处理不完整和不确定知识的数学工具。粗糙集能有效地分析和处理各种不完备信息,并从中发现隐含的信息规律。目前大多数对与空气质量的预测都是利用粗糙集来进行预测,但是粗糙集理论需要建立在不可分辨关系也就是等价关系上,由于等价关系的要求比较严格,而且对错误信息的容忍度较低,当数据集中存在大量噪声的时候粗糙集的泛化普遍较弱,导致预测准确性不稳定。

技术实现思路

[0005]为了解决现有技术中存在由于污染物的数据获取存在误差,污染物数据可能不完整或者冗余,增大了空气质量分析和预测的工作难度;粗糙集理论需要建立在不可分辨关系也就是等价关系上,由于等价关系的要求比较严格,而且对错误信息的容忍度较低,当数据集中存在大量噪声的时候粗糙集的泛化普遍较弱,导致预测准确性不稳定的问题,本专利技术提出一种基于粗糙集和结构风险最小化的空气质量预测方法,包括:
[0006]S1:从气象监测站点获取与空气质量相关的环境参数样本数据;
[0007]S2:建立空气质量评价体系对从气象监测站点获取的环境参数样本数据进行等级评价得到环境参数样本的空气质量指数等级;
[0008]S3:根据环境参数样本数据将与空气质量相关的环境参数作为条件属性,以环境参数样本的空气质量指数等级作为决策属性创建空气质量指数决策表;
[0009]S4:根据空气质量指数决策表中的条件属性生成有限个条件属性子集,并利用粗糙集理论和结构风险最小化理论计算条件属性子集的经验误差和条件属性子集与决策属性的互信息;
[0010]S5:根据条件属性子集的经验误差和条件属性子集与决策属性的互信息利用遗传算法计算得出最优条件属性子集;
[0011]S6:将最优条件属性子集中的条件属性作为粗糙集分类器的条件属性以目标监测点的环境参数数据对空气质量进行预测,得到空气质量结果。
[0012]本专利技术至少具有以下有益效果
[0013]本专利技术将粗糙集理论与结构风险最小化准则相结合,利用粗糙集理论能够定量分析,从而推理和解释数据间关系的特点,加入结构风险最小化准则,让预测误差和复杂性之间取得一个均衡,提高了空气质量预测的稳定性和鲁棒性。结合遗传算法在不降低分类精确度的前提下降低特征维度,提高了空气质量预测的速度。
附图说明
[0014]图1为本专利技术的方法流程图;
[0015]图2为本专利技术所述的结构风险最小化准则示意图;
[0016]图3为本专利技术遗传算法流程图。
具体实施方式
[0017]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0018]请参阅图1,本专利技术提供一种基于粗糙集和结构风险最小化的空气质量预测方法,包括:
[0019]S1:从气象监测站点获取与空气质量相关的环境参数样本数据;
[0020]组成空气质量指数的主要污染物有PM2.5、PM10、S02、NO2、CO、O3、TSP(悬浮颗粒物)、DF(降尘)等八项;因此本专利技术主要采集的环境参数为PM2.5、PM10、S02、NO2、CO、O3、TSP(悬浮颗粒物)、DF(降尘);环境参数样本数据为PM2.5、PM10、S02、NO2、CO、O3、TSP(悬浮颗粒物)、DF(降尘)对应的污染物浓度。
[0021]S2:建立空气质量评价体系对从气象监测站点获取的环境参数样本数据进行等级评价得到环境参数样本的空气质量指数等级;
[0022]所述空气质量评价体系参照国家标准《GB 3095—2012》为依据划分优、良、轻度污染、中度污染、重度污染和严重污染六个空气质量指数等级,建立空气质量指数等级评价体系。空气质量指数0~50为等级一;空气质量指数51~100,为等级二;空气质量指数101~150,为等级三;空气质量指数151~200,为等级四;空气质量指数201~300,为等级五;空气质量指数大于300,为等级六,如表1所示:
[0023]表1空气质量评价表
[0024][0025]根据国家标准《GB 3095—2012》中对各种环境参数的等级浓度限值划分3个区间,分别编码为低、中和高,低表示环境参数未超标,中表示环境参数超标,高表示环境参数严重超标;令A1,A2,A3,A4,A5,A6,A7,A8分别表示环境参数为PM2.5、PM10、S02、NO2、CO、O3、TSP(悬浮颗粒物)、DF(降尘)得到环境参数评价表。
[0026]根据环境参数评价表对环境参数样本数据中的环境参数样本数据进行评价,并根据空气质量指数评价表得到环境参数样本数据对应的空气质量指数等级。
[0027]S3:根据环境参数样本数据将与空气质量相关的环境参数作为条件属性,以环境参数样本的空气质量指数等级作为决策属性创建空气质量指数决策表,所述空气质量指数决策表如表2所示:
[0028]表2空气质量指数决策表
[0029]论域A1A2A3A4A5A6A7A8Dx1低低低中低低中中等级2x2低低高中低低高中等级3x3低低低中低低低中等级1x4低中低中低中低中等级2x5中中中高中中中高等级2x6高中高高高高中高等级4x7低中中高低中中高等级3x8高中高高高中高高等级5
…………………………
[0030]其中,x1表示第一个环境参数样本数据,x2表示第二个环境参数样本数据

依此类推,D表示环境参数样本数据对应的空气质量指数等级。
[0031]粗糙集理论:
[0032]粗糙集是一种处理不精确、不确定和不完全数据的新的数学方法,它可以通过对数据的分析和推理来发现隐含的知识、揭示潜在的规律。它通过一对精确的集合:上近似和下近似,来对不确定的目标集合进行确定的近似描述。
[0033]设S为信息表,S表示为:S=(U,At=C∪{d},{V
a
|a∈At},{I
a
|a∈At})
[0034]U为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于粗糙集和结构风险最小化的空气质量预测方法,其特征在于,包括:S1:从气象监测站点获取与空气质量相关的环境参数样本数据;S2:建立空气质量评价体系对从气象监测站点获取的环境参数样本数据进行等级评价得到环境参数样本的空气质量指数等级;S3:根据环境参数样本数据将与空气质量相关的环境参数作为条件属性,以环境参数样本的空气质量指数等级作为决策属性创建空气质量指数决策表;S4:根据空气质量指数决策表中的条件属性生成有限个条件属性子集,并利用粗糙集理论和结构风险最小化理论计算条件属性子集的经验误差和条件属性子集与决策属性的互信息;S5:根据条件属性子集的经验误差和条件属性子集与决策属性的互信息利用遗传算法计算得出最优条件属性子集;S6:将最优条件属性子集中的条件属性作为粗糙集分类器的条件属性以目标监测点的环境参数数据对空气质量进行预测,得到空气质量结果。2.根据权利要求1所述的一种基于粗糙集和结构风险最小化的空气质量预测方法,其特征在于,所述利用粗糙集理论和结构风险最小化理论计算条件属性子集的经验误差和条件属性子集与决策属性的互信息包括:S41:根据粗糙集理论得到空气质量指数决策表的决策信息系统;S42:根据决策信息系统中决策属性子集D关于条件属性子集B的依赖度,计算条件属性子集的经验误差;S43:根据结构风险最小化准则引入互信息正则化函数计算条件属性子集与决策属性的互信息。3.根据权利要求2所述的一种基于粗糙集和结构风险最小化的空气质量预测方法,其特征在于,所述条件属性子集的经验误差包括:R
emp
(B)=1

γ
B
(D)其中,|
·
|表示集合的基数,即集合内元素的个数;U/IND(B)={X1,X2,

,X
n
}表示由条件属性子集B导出的一个划分,X
i
表示该划分中的一个等价类,[x]
D
表示由决策属性D导出的一个划分为U/IND(D)。4.根据权利要求2所述的一种基于粗糙集和结构风险最小化的空气质量预测方法,其特征在于,所述条件属性子集与决策...

【专利技术属性】
技术研发人员:张晓霞张蓬浩王国胤
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1