【技术实现步骤摘要】
一种基于ISCSO和TOPSIS的PM2.5浓度预测方法
[0001]本专利技术属于空气质量监控
,涉及一种基于ISCSO和TOPSIS的PM2.5浓度预测方法。
技术介绍
[0002]以PM2.5为主要污染物的雾霾天气发生,对人们的身体健康、生产、生活等方面产生诸多不良影响,因此降低PM2.5浓度,加大对环境的保护已成为当前一项紧迫的任务。利用历史数据对PM2.5浓度进行预测,让人们更清楚地了解空气质量状况,有着非常重要的意义。当前PM2.5浓度预测方法大致分为两类:一类是基于传统的统计学模型的方法,如自回归综合移动平均模型(ARIMA)和向量自回归模型(VAR);一类是基于机器学习模型的方法,如支持向量回归模型(SVR),极限梯度提升模型(XGBoost)和卷积神经网络
‑
长短期记忆模型(CNN
‑
LSTM)等。虽然这些方法在PM2.5浓度预测领域取得了良好的应用效果,但在许多方面还是存在缺陷,比如基于传统的统计学模型的方法特征提取能力弱,不确定性表达能力有限,容易导致预测结果不准确或稳定性差。虽然基于机器学习模型的方法相比于基于传统的统计学模型的方法,在处理非线性数据和高维数据方面有优势,但是这些方法的超参数是否合理设置,对预测性能起着至关重要的作用;此外,基于机器学习模型的单一预测方法也存在预测精度和稳定性不足等问题。
技术实现思路
[0003]有鉴于此,本专利技术的目的在于提供一种基于ISCSO和TOPSIS的PM2.5浓度预测方法,解决基于机器学习 ...
【技术保护点】
【技术特征摘要】
1.一种基于ISCSO和TOPSIS的PM2.5浓度预测方法,其特征在于:该方法包括以下步骤:S1、获取城市历史PM2.5浓度监测数据,并预处理,构建特征数据集;S2、对特征数据集进行处理,并划分为训练集、验证集和测试集;S3、利用改进的沙猫群优化算法(ISCSO)分别搜索SVR模型、XGBoost模型和CNN
‑
LSTM模型的最优超参数;S4、基于步骤S2和S3得到的训练集、验证集、测试集以及最优超参数,分别构建并训练SVR模型、XGBoost模型和CNN
‑
LSTM模型,再分别进行PM2.5浓度预测;S5、将SVR模型、XGBoost模型和CNN
‑
LSTM模型的PM2.5浓度预测结果作为优劣解距离算法(TOPSIS)的输入,进行组合预测,得出最终的PM2.5浓度预测结果。2.根据权利要求1所述的PM2.5浓度预测方法,其特征在于:所述步骤S1具体包括以下步骤:S11、获取城市历史PM2.5浓度监测数据,包括监测时间、温度、气压、湿度、降雨量、风向、风速、PM10浓度、SO2浓度、NO2浓度、CO浓度、O3浓度以及PM2.5浓度;S12、将步骤S11中的数据按照时间对齐;S13、选择缺失值较少的数据,使用上一个或者下一个值填补其中的缺失。3.根据权利要求1所述的PM2.5浓度预测方法,其特征在于:所述步骤S2具体包括以下步骤:S21、对数据集进行归一化,如下式所示:式中,x
′
表示归一化后的值,x表示当前数据的取值,min表示数据所在列的最小值,max表示数据所在列的最大值;S22、采用标签编码方式将风向数据列的数据由标签形式转换为数值形式;S23、将处理后的数据集按照数据采集时间进行排序,并按照预设比例分成训练集、验证集和测试集;S24、将训练集、验证集以及测试集中的数据拆分为自变量和因变量;S25、将测试集和验证集中拆分的自变量和因变量作为SVR模型、XGBoost模型和CNN
‑
LSTM模型的输入。4.根据权利要求3所述的PM2.5浓度预测方法,其特征在于:在步骤S24中,所述自变量包括监测时间、温度、气压、湿度、降雨量、风向、风速、PM10浓度、SO2浓度、NO2浓度、CO浓度和O3浓度;所述因变量包括PM2.5浓度。5.根据权利要求1所述的PM2.5浓度预测方法,其特征在于:所述步骤S3具体包括以下步骤:S31、将SVR模型、XGBoost模型和CNN
‑
LSTM模型的预测结果与实际值产生的均方根误差作为评价标准,即作为ISCSO寻优的目标函数;S32、分别将SVR模型、XGBoost模型和CNN
‑
LSTM模型嵌入ISCSO模型中,同时将SVR模型、XGBoost模型和CNN
‑
LSTM模型需要寻优的超参数设置为ISCSO模型中对应的搜索维度,在设置完成后分别进行迭代寻优,在迭代寻优完成后选取目标函数值最小的一组超参数输出,作为SVR模型、XGBoost模型和CNN
‑
LSTM模型的超参数。
6.根据权利要求1所述的PM2.5浓度预测方法,其特征在于:所述步骤S4具体包括以下步骤:S41、将步骤S3寻优输出的SVR模型、XGBoost模型和CNN
‑
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。