当前位置: 首页 > 专利查询>金陈卓专利>正文

基于数据融合的短时空气质量预测方法及系统技术方案

技术编号:37076830 阅读:13 留言:0更新日期:2023-03-29 19:53
本发明专利技术涉及人工智能技术领域,提供一种基于数据融合的短时空气质量预测方法,提取历史空气质量数据中的多个特征因子,并进行数据预处理,采用小波去噪方法对污染物数据样本X进行处理,输出的第一数据集为X

【技术实现步骤摘要】
基于数据融合的短时空气质量预测方法及系统


[0001]本专利技术涉及人工智能
,特别涉及一种基于数据融合的短时空气质量预测方法及系统。

技术介绍

[0002]大气污染物因子有很多种,PM2.5是指大气中直径小于或等于2.5微米的颗粒物,富含大量的有毒、有害物质且在大气中的停留时间长、输送距离远,因而对人体健康和大气环境质量的影响更大,它对空气质量和能见度等有重要的影响,PM2.5也是天气阴霾的主要原因。
[0003]CN109670646B公开了一种基于混合门限神经网络的PM2.5浓度值预测方法,包括如下步骤:步骤1、原始数据采集,原始数据包括PM2.5浓度值历史数据、PM2.5浓度值指标历史数据和气象历史数据;步骤2、通过更新门函数和重置门函数构建了模拟门限网络,对原始数据进行初步预测,得到了PM2.5模拟数据;步骤3、通过更新门函数、重置门函数和softmax函数构建了判别门限网络,对模拟数据的真实性进行了判别;步骤4、采用混合门限神经网络预测PM2.5浓度值。
[0004]CN114444561A公开了一种基于CNNs

GRU融合深度学习模型的PM2.5预测方法,取某区域若干个监测站的空气质量相关数据,构成多站点多模态空气质量数据集;S2:对多站点多模态空气质量数据进行预处理,包括数值化编码、缺失值填充、异常值修正、周期性特征构造和数据集划分;S3:基于CNN和GRU,以多站点多模态空气质量数据为输入,构建适用于PM2.5预测的深度学习模型CNNs

GRU;S4:基于训练集、验证集训练CNNs

GRU模型,并对模型进行优化;S5:在测试集上运行最优CNNs

GRU模型,获得某区域未来24小时PM2.5浓度的精细化预测结果。
[0005]CN111340292B公开了一种基于聚类的集成神经网络PM2.5预测方法。包括以下步骤:S1)获取历史PM2.5数据和气象数据,进行数据预处理后,得到数据集;S2)使用皮尔逊相关系数分析PM2.5与包括气象数据和时间戳的辅助数据的相关性,以利用提取的特征提高聚类性能,以及训练集成神经网络;S3)建立基于风向的聚类方法,以考虑风向对PM2.5的影响,提高预测的精度;S4)建立集神经网络、递归神经网络和长短时间记忆网络于一体的集成神经网络模型来预测PM2.5浓度,以减小单一模型的过拟合问题;S5)以过去一段时间的数据为输入,输入集成神经网络,分析和预测未来的PM2.5数据。
[0006]CN114626605A公开了一种基于模态分解的混合模型的空气污染物浓度预测方法,获取该地区的所有空气质量站的PM2.5、其他污染物以及气象因子,并进行空间依赖分析,采用0.85作为相关阈值,处理得到目标站与邻近站的PM2.5、其他污染物以及气象因子的序列;并采用CEEMDAN对PM2.5进行序列分解,并利用PM2.5分解后子序列、其他污染物以及气象因子对构建的CNN

GRU混合模型进行训练,得到训练好的PM2.5浓度预测模型,对目标站PM2.5浓度进行预测。
[0007]现有技术中,采用单一空气质量因子难以实现对PM2.5短时预测且预测精度不高;
采用大量的空气质量数据输入传统的神经网络模型,不仅计算量大,并且预测准确率不高。

技术实现思路

[0008]经过长期实践发现,多个空气质量数据作为神经网络预测模型的输入,往往出现多个输入变量因子交叉干涉,并且数据量大的情况下,整个预测模型计算量大,从而导致效率低;由于空气质量数据样本属于非线性和非稳态的时间序列数据,传统的神经网络模型不能够很好的学习到空气质量数据样本的有效特征,特别会影响预测峰谷值位置的精度。
[0009]有鉴于此,本专利技术旨在提出一种基于数据融合的短时空气质量预测方法,所述基于数据融合的短时空气质量预测方法包括,
[0010]步骤S1,提取历史空气质量数据中的多个特征因子,并进行数据预处理,其中,特征因子至少包括PM2.5、PM10、SO2、CO、NO2、O3、大气温度、大气湿度、降雨和风速;提取污染物数据样本X为气象用数据样本X
*
为X
*
={x
temp
,x
hum
,x
rain
,x
wind
},采用小波去噪方法对污染物数据样本X进行处理,输出的第一数据集为X
W
;同时,采用变分模态分解法将污染物数据样本X分解为多模态分量集X
V

[0011]步骤S2,采用第一数据集为X
W
、多模态分量集X
V
与气象数据集合X*进行融合生成融合数据集D,采用主成分分析方法对融合数据集D进行降维和特征提取,输出的第二数据集X


[0012]步骤S3,将第二数据集X

作为输入,采用训练好的BiLSTM模型进行PM2.5浓度预测,并输出PM2.5的预测值。
[0013]优选地,在步骤S1的中小波去噪方法中,将污染物数据样本X映射到小波域,其中,
[0014]x
i
=a1+ε*e1[0015]x
i
为污染物数据样本X中第i项含噪信号,a1为有用信号,e1为噪声,ε为噪声系数的标准差。
[0016]优选地,在步骤S1的中变分模态分解法中,将污染物数据样本X中非稳态信号分解得到一组固有频率的模态分量为,
[0017]x
i
={IMF1,IMF2,

,IMF
m
}
[0018]其中,x
i
为污染物数据样本X中第i项含噪信号,IMF
m
为第m个模态分量。
[0019]优选地,第一数据集为X
W
、多模态分量集X
V
与气象数据集合X*进行融合生成融合数据集D为,
[0020]{X
W
,X
V
,X
*
}={d1,d2,

,d
n
}
[0021]其中,n为具体特征d总数量,在步骤S2中主成分分析方法中,
[0022]X
′←
P
PCA
(X
W
,X
V
,X
*
)
[0023]其中,P
PCA
表示主成分分析方法,X

为主成分分析方法处理后的输出数据集;
[0024]第i个主成分Pc
i

[0025][0026]其中,为融合数据集D中的元素经过标准化处理的值,ω
1i
、ω
2i
、ω
ni
为融合数据集D的协方差矩阵的特征值所对应的特征向量。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据融合的短时空气质量预测方法,其特征在于,所述基于数据融合的短时空气质量预测方法包括,步骤S1,提取历史空气质量数据中的多个特征因子,并进行数据预处理,其中,特征因子至少包括PM2.5、PM10、SO2、CO、NO2、O3、大气温度、大气湿度、降雨和风速;提取污染物数据样本X为气象用数据样本X
*
为X
*
={x
temp
,x
hum
,x
rain
,x
wind
},采用小波去噪方法对污染物数据样本X进行处理,输出的第一数据集为X
W
;同时,采用变分模态分解法将污染物数据样本X分解为多模态分量集X
V
;步骤S2,采用第一数据集为X
W
、多模态分量集X
V
与气象数据集合X*进行融合生成融合数据集D,采用主成分分析方法对融合数据集D进行降维和特征提取,输出的第二数据集X

;步骤S3,将第二数据集X

作为输入,采用训练好的BiLSTM模型进行PM2.5浓度预测,并输出PM2.5的预测值。2.根据权利要求1所述的基于数据融合的短时空气质量预测方法,其特征在于,在步骤S1的中小波去噪方法中,将污染物数据样本X映射到小波域,其中,x
i
=a1+ε*e1x
i
为污染物数据样本X中第i项含噪信号,a1为有用信号,e1为噪声,ε为噪声系数的标准差。3.根据权利要求1所述的基于数据融合的短时空气质量预测方法,其特征在于,在步骤S1的中变分模态分解法中,将污染物数据样本X中非稳态信号分解得到一组固有频率的模态分量为,x
i
={IMF1,IMF2,...,IMF
m
}其中,x
i
为污染物数据样本X中第i项含噪信号,IMF
m
为第m个模态分量。4.根据权利要求1所述的基于数据融合的短时空气质量预测方法,其特征在于,第一数据集为X
W
、多模态分量集X
V
与气象数据集合X*进行融合生成融合数据集D为,{X
W
,X
V
,X
*
}={d1,d2,...,d
n
}其中,n为具体特征d总数量,在步骤S2中主成分分析方法中,X
′←
P
PCA
(X
W
,X
V
,X
*
)其中,P
PCA
表示主成分分析方法,X

为主成分分析方法处理后的输出数据集;第i个主成分pc
i
为其中,为融合数据集D中的元素经过标准化...

【专利技术属性】
技术研发人员:金陈卓
申请(专利权)人:金陈卓
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1