一种基于ISCSO和TOPSIS的PM2.5浓度预测方法技术

技术编号:38390530 阅读:11 留言:0更新日期:2023-08-05 17:43
本发明专利技术涉及一种基于ISCSO和TOPSIS的PM2.5浓度预测方法,属于空气质量监控技术领域。该方法步骤为:获取城市历史PM2.5浓度监测数据,构建特征数据集;处理特征数据集并划分为训练集、验证集和测试集;利用ISCSO分别搜索各单一模型的最优超参数;基于训练集、验证集、测试集以及最优超参数,分别构建并训练各单一预测模型并分别进行PM2.5浓度预测;将各单一预测模型的PM2.5浓度预测结果作为TOPSIS的输入,进行组合预测,得出最终的PM2.5浓度预测结果。本发明专利技术能够实现机器学习模型的超参数自动优化,并对各个模型进行组合预测,最终得出更准确的、稳定的PM2.5浓度预测结果。稳定的PM2.5浓度预测结果。稳定的PM2.5浓度预测结果。

【技术实现步骤摘要】
一种基于ISCSO和TOPSIS的PM2.5浓度预测方法


[0001]本专利技术属于空气质量监控
,涉及一种基于ISCSO和TOPSIS的PM2.5浓度预测方法。

技术介绍

[0002]以PM2.5为主要污染物的雾霾天气发生,对人们的身体健康、生产、生活等方面产生诸多不良影响,因此降低PM2.5浓度,加大对环境的保护已成为当前一项紧迫的任务。利用历史数据对PM2.5浓度进行预测,让人们更清楚地了解空气质量状况,有着非常重要的意义。当前PM2.5浓度预测方法大致分为两类:一类是基于传统的统计学模型的方法,如自回归综合移动平均模型(ARIMA)和向量自回归模型(VAR);一类是基于机器学习模型的方法,如支持向量回归模型(SVR),极限梯度提升模型(XGBoost)和卷积神经网络

长短期记忆模型(CNN

LSTM)等。虽然这些方法在PM2.5浓度预测领域取得了良好的应用效果,但在许多方面还是存在缺陷,比如基于传统的统计学模型的方法特征提取能力弱,不确定性表达能力有限,容易导致预测结果不准确或稳定性差。虽然基于机器学习模型的方法相比于基于传统的统计学模型的方法,在处理非线性数据和高维数据方面有优势,但是这些方法的超参数是否合理设置,对预测性能起着至关重要的作用;此外,基于机器学习模型的单一预测方法也存在预测精度和稳定性不足等问题。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种基于ISCSO和TOPSIS的PM2.5浓度预测方法,解决基于机器学习模型的方法在超参数优化、预测精度和稳定性等方面存在的问题。
[0004]为达到上述目的,本专利技术提供如下技术方案:
[0005]一种基于ISCSO和TOPSIS的PM2.5浓度预测方法,该方法包括以下步骤:
[0006]S1、获取城市历史PM2.5浓度监测数据,并预处理,构建特征数据集;
[0007]S2、对特征数据集进行处理,并划分为训练集、验证集和测试集;
[0008]S3、利用改进的沙猫群优化算法(ISCSO)分别搜索SVR模型、XGBoost模型和CNN

LSTM模型的最优超参数;
[0009]S4、基于步骤S2和S3得到的训练集、验证集、测试集以及最优超参数,分别构建并训练SVR模型、XGBoost模型和CNN

LSTM模型,再分别进行PM2.5浓度预测;
[0010]S5、将SVR模型、XGBoost模型和CNN

LSTM模型的PM2.5浓度预测结果作为优劣解距离算法(TOPSIS)的输入,进行组合预测,得出最终的PM2.5浓度预测结果。
[0011]进一步,步骤S1具体包括以下步骤:
[0012]S11、获取城市历史PM2.5浓度监测数据,包括监测时间、温度、气压、湿度、降雨量、风向、风速、PM10浓度、SO2浓度、NO2浓度、CO浓度、O3浓度以及PM2.5浓度;
[0013]S12、将步骤S11中的数据按照时间对齐;
[0014]S13、选择缺失值较少的数据,使用上一个或者下一个值填补其中的缺失。
[0015]进一步,步骤S2具体包括以下步骤:
[0016]S21、对数据集进行归一化,如下式所示:
[0017][0018]式中,x

表示归一化后的值,x表示当前数据的取值,min表示数据所在列的最小值,max表示数据所在列的最大值;
[0019]S22、采用标签编码方式将风向数据列的数据由标签形式转换为数值形式;
[0020]S23、将处理后的数据集按照数据采集时间进行排序,并按照预设比例分成训练集、验证集和测试集;
[0021]S24、将训练集、验证集以及测试集中的数据拆分为自变量和因变量;
[0022]S25、将训练集和验证集数据中,拆分的自变量和因变量作为SVR模型、XGBoost模型和CNN

LSTM模型的输入。
[0023]其中,在步骤S24中,自变量包括监测时间、温度、气压、湿度、降雨量、风向、风速、PM10浓度、SO2浓度、NO2浓度、CO浓度和O3浓度;因变量包括PM2.5浓度。
[0024]进一步,步骤S3具体包括以下步骤:
[0025]S31、将SVR模型、XGBoost模型和CNN

LSTM模型的预测结果与实际值产生的均方根误差作为评价标准,即作为ISCSO寻优的目标函数;
[0026]S32、分别将SVR模型、XGBoost模型和CNN

LSTM模型嵌入ISCSO模型中,同时将SVR模型、XGBoost模型和CNN

LSTM模型需要寻优的超参数设置为ISCSO模型中对应的搜索维度,在设置完成后分别进行迭代寻优,在迭代寻优完成后选取目标函数值最小的一组超参数输出,作为SVR模型、XGBoost模型和CNN

LSTM模型的超参数。
[0027]进一步,步骤S4具体包括以下步骤:
[0028]S41、将步骤S3寻优输出的SVR模型、XGBoost模型和CNN

LSTM模型的超参数分别作为各模型实际进行预测时所需的超参数,同时将步骤S2得到的训练集和验证集作为各模型的输入并分别进行训练;
[0029]S42:基于训练后的SVR模型、XGBoost模型和CNN

LSTM模型,将测试集中的自变量输入到各模型中,分别进行PM2.5浓度预测。
[0030]进一步,步骤S5具体包括以下步骤:
[0031]S51、分别计算各模型在t时刻的预测精度,并将过去n阶预测精度方差作为t时刻的属性值,构建t时刻的决策矩阵[A
it
,S(A
i
)]i=1,...,m
,计算方式如下:
[0032]A
it
=1

|e
it
|
[0033]式中,t=1,

,n,A
it
表示模型i在预测时刻t的预测精度,e
it
表示模型i在t时刻的预测结果的相对误差,S(A
i
)表示模型i的预测结果序列的方差;
[0034]S52、将决策矩阵规范化:
[0035]r
i1
=A
i
[0036]r
i2
=1

S(A
i
)
[0037]式中,A
i
表示模型i的预测精度序列,r
i1
表示效益型属性,r
i2
表示成本型属性;
[0038]根据r
i1
和r
i2
构成规范化决策矩阵[A
i
,1

S(A
i本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于ISCSO和TOPSIS的PM2.5浓度预测方法,其特征在于:该方法包括以下步骤:S1、获取城市历史PM2.5浓度监测数据,并预处理,构建特征数据集;S2、对特征数据集进行处理,并划分为训练集、验证集和测试集;S3、利用改进的沙猫群优化算法(ISCSO)分别搜索SVR模型、XGBoost模型和CNN

LSTM模型的最优超参数;S4、基于步骤S2和S3得到的训练集、验证集、测试集以及最优超参数,分别构建并训练SVR模型、XGBoost模型和CNN

LSTM模型,再分别进行PM2.5浓度预测;S5、将SVR模型、XGBoost模型和CNN

LSTM模型的PM2.5浓度预测结果作为优劣解距离算法(TOPSIS)的输入,进行组合预测,得出最终的PM2.5浓度预测结果。2.根据权利要求1所述的PM2.5浓度预测方法,其特征在于:所述步骤S1具体包括以下步骤:S11、获取城市历史PM2.5浓度监测数据,包括监测时间、温度、气压、湿度、降雨量、风向、风速、PM10浓度、SO2浓度、NO2浓度、CO浓度、O3浓度以及PM2.5浓度;S12、将步骤S11中的数据按照时间对齐;S13、选择缺失值较少的数据,使用上一个或者下一个值填补其中的缺失。3.根据权利要求1所述的PM2.5浓度预测方法,其特征在于:所述步骤S2具体包括以下步骤:S21、对数据集进行归一化,如下式所示:式中,x

表示归一化后的值,x表示当前数据的取值,min表示数据所在列的最小值,max表示数据所在列的最大值;S22、采用标签编码方式将风向数据列的数据由标签形式转换为数值形式;S23、将处理后的数据集按照数据采集时间进行排序,并按照预设比例分成训练集、验证集和测试集;S24、将训练集、验证集以及测试集中的数据拆分为自变量和因变量;S25、将测试集和验证集中拆分的自变量和因变量作为SVR模型、XGBoost模型和CNN

LSTM模型的输入。4.根据权利要求3所述的PM2.5浓度预测方法,其特征在于:在步骤S24中,所述自变量包括监测时间、温度、气压、湿度、降雨量、风向、风速、PM10浓度、SO2浓度、NO2浓度、CO浓度和O3浓度;所述因变量包括PM2.5浓度。5.根据权利要求1所述的PM2.5浓度预测方法,其特征在于:所述步骤S3具体包括以下步骤:S31、将SVR模型、XGBoost模型和CNN

LSTM模型的预测结果与实际值产生的均方根误差作为评价标准,即作为ISCSO寻优的目标函数;S32、分别将SVR模型、XGBoost模型和CNN

LSTM模型嵌入ISCSO模型中,同时将SVR模型、XGBoost模型和CNN

LSTM模型需要寻优的超参数设置为ISCSO模型中对应的搜索维度,在设置完成后分别进行迭代寻优,在迭代寻优完成后选取目标函数值最小的一组超参数输出,作为SVR模型、XGBoost模型和CNN

LSTM模型的超参数。
6.根据权利要求1所述的PM2.5浓度预测方法,其特征在于:所述步骤S4具体包括以下步骤:S41、将步骤S3寻优输出的SVR模型、XGBoost模型和CNN

【专利技术属性】
技术研发人员:鲜思东李鑫谢佳欣
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1