当前位置: 首页 > 专利查询>暨南大学专利>正文

基于多尺度特征提取和深度学习的PM制造技术

技术编号:30229801 阅读:39 留言:0更新日期:2021-09-29 10:00
本发明专利技术公开了基于多尺度特征提取和深度学习的PM

【技术实现步骤摘要】
基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法及系统


[0001]本专利技术涉及大气环境质量管理研究领域,特别涉及一种基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法及系统。

技术介绍

[0002]目前关于PM
2.5
预测的研究主要有2种模式:数值模式和统计预报模式。数值模式探究源污染物的扩散方式并确定排放源和空气污染浓度之间的数学关系,随后总结出扩散方程并进行数值求解。大气数值模式可以预测污染物在一定时刻与地点的浓度情况。但利用数值模式方法进行预测分析是比较复杂和耗时的,模拟结果易受污染物排放量和选定变量的影响,而且不容易获得精确的污染源以及气象因素的时空分布资料,因此数值模式的精度比较低。
[0003]随着计算机等技术的发展,统计预报模式引起了越来越多人的关注。统计预报模式不探究事务的本身机理,可以从海量数据发现学习数据的规律和模式,挖掘出潜在的信息从而仅仅通过分析事物的表现规律进行PM
2.5
浓度的预测。除此之外,统计预报模式能挖掘数据的潜在信息并获得非常好的预测效果。从宏观上来分类,统计预报模式可以分为时间序列模型、支持向量机模型、人工神经网络等。
[0004]人工神经网络具有自适应学习等能力,非常适合处理污染物时变序列的预测问题。传统人工神经网络忽略了污染物时间特性导致精度不高。而长短期记忆神经网络(LSTM)能够可以精确地学习到输入输出的时序关系,结合历史信息对未来时刻的信息进行预测,有效解决PM
>2.5
时间序列的预测问题。
[0005]但由于受到气象条件,地理位置,季节变换,政治经济等诸多复杂因素的影响,PM
2.5
数据在不同地区具有不同的周期性和随机性。一方面,在一定地域的不同人为及气象因素影响下,PM
2.5
浓度存在不同尺度的变化周期,沿着时间轴按照一定趋势呈多尺度周期性变化;另一方面,PM
2.5
浓度容易随着其他因素的变化而发生波动,如刮风,降雨,北方城市冬季供暖以及政策变化。单一统计手段并不能完全捕捉各地PM
2.5
的多尺度周期及波动特性和实现对当地PM
2.5
的准确预测。
[0006]针对PM
2.5
的多尺度周期混合而导致模型预测精度不高的问题,研究表明数据分解预处理是有效的解决方法。由于能有效实现分解非线性和非静止时间系列,以及描述本地时间尺度瞬时频率,基于自适应噪声的完备经验模态分解(CEEMDAN)可以提取出原始PM
2.5
不同维度的信息以及测定出不同因子对时间序列的影响状况,使得网络有更强的泛化能力。
[0007]然而,尽管CEEMDAN可以有效地降低非线性时间系列预测的难度,但仍有改进的余地。事实上,当原始时间系列的非线性较高,CEEMDAN分解获得的第一个内在模式函数(IMF1)将更加不规则,从而影响预测精度。单一分解方法产生的子系列的不规则频率范围和动态复杂性,造成预测建模的困难。

技术实现思路

[0008]本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法及系统。
[0009]本专利技术的第一目的在于提供基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法。
[0010]本专利技术的第二目的在于提供基于多尺度特征提取和深度学习的PM
2.5
浓度预测系统。
[0011]本专利技术的第一目的通过以下的技术方案实现:
[0012]基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法,包括以下步骤:
[0013]获取基础数据,对基础数据进行预处理,得到预处理数据;
[0014]将预处理数据进行模态分解,得到分解数据,并根据频率高低进行排序;
[0015]对频率最高的分解数据再次模态分解,得到再分解数据;
[0016]对分解数据和再分解数据进行归一化处理并存储;
[0017]搭建长短期记忆网络,并对归一化处理的数据构建预测网络;
[0018]将长短期记忆网络的预测结果进行合并和反归一化处理,得到预测结果。
[0019]进一步地,所述获取基础数据,对基础数据进行预处理,得到预处理数据,具体为:获取基础数据,将基础数据进行缺失值识别并替补,分类整理保存为.mat文件;所述基础数据为当地PM
2.5
时间序列。
[0020]进一步地,所述缺失值用于判断基础数据是否需要替补,具体如下:所述缺失值少于5%时对模型预测性能影响较少,仅进行剔除处理;当缺失值大于5%时使用替补手段进行替补;替补手段采用均值替补,即以两个记录或前一个记录的平均值进行替换。
[0021]进一步地,所述将预处理数据进行模态分解,得到分解数据,并根据频率高低进行排序,具体为:将预处理数据通过基于自适应白噪声的完备总体经验模态分解技术转换成M个频率从高到低排序的内涵模态分量以及1个剩余分量。
[0022]进一步地,所述通过基于自适应白噪声的完备总体经验模态分解,具体如下:
[0023]1)、通过在原始PM
2.5
序列中加入白噪声来获得噪声信号集:
[0024]s
i
(t)=s(t)+ε0ω
i
(t),i=1,2,...,N
ꢀꢀ
(1)
[0025]其中s
i
(t)表示第i个噪声信号;s(t)表示原始信号;ε表示噪声标准差;ω
i
(t)表示白噪声序列;N表示测试次数;
[0026]2)、对噪声信号进行EMD分解,对分解结果进行平均,得到第一内涵模态分量:
[0027][0028]其中表示第j个模式组件;N表示测试次数;IMF
1i
表示第i次测试得到的IMF;
[0029]3)、计算第一个剩余分量:
[0030][0031]其中r1(t)表示第一个剩余分量;s(t)表示原始信号;表示第1个模式组件;
[0032]4)、分解获得第二个模式:
[0033][0034]其中表示第二个模式组件;N表示测试次数;E
k
(
·
)表示生成通过EMD分解获得的第k个模式的运算符;r1(t)表示第一个剩余分量;ε1E表示噪声标准差;ω
i
(t)表示白噪声序列;
[0035]5)、计算j=2,3,

,j的第j个余数:
[0036][0037]其中r
j
(t)表示第j个剩余分量;r
j
‑1(t)表示第j

1个剩余分量;表示第j个模式组件;
[0038]6)、对r
j
(t)+ε
j
E<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法,其特征在于,包括以下步骤:获取基础数据,对基础数据进行预处理,得到预处理数据;将预处理数据进行模态分解,得到分解数据,并根据频率高低进行排序;对频率最高的分解数据再次模态分解,得到再分解数据;对分解数据和再分解数据进行归一化处理并存储;搭建长短期记忆网络,并对归一化处理的数据构建预测网络;将长短期记忆网络的预测结果进行合并和反归一化处理,得到预测结果。2.根据权利要求1所述的基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法,其特征在于,所述获取基础数据,对基础数据进行预处理,得到预处理数据,具体为:获取基础数据,将基础数据进行缺失值识别并替补,分类整理保存为.mat文件;所述基础数据为当地PM
2.5
时间序列。3.根据权利要求2所述的基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法,其特征在于,所述缺失值用于判断基础数据是否需要替补,具体如下:所述缺失值少于5%时对模型预测性能影响较少,仅进行剔除处理;当缺失值大于5%时使用替补手段进行替补;替补手段采用均值替补,即以两个记录或前一个记录的平均值进行替换。4.根据权利要求1所述的基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法,其特征在于,所述将预处理数据进行模态分解,得到分解数据,并根据频率高低进行排序,具体为:将预处理数据通过基于自适应白噪声的完备总体经验模态分解技术转换成M个频率从高到低排序的内涵模态分量以及1个剩余分量。5.根据权利要求4所述的基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法,其特征在于,所述通过基于自适应白噪声的完备总体经验模态分解,具体如下:1)、通过在原始PM
2.5
序列中加入白噪声来获得噪声信号集:s
i
(t)=s(t)+ε0ω
i
(t),i=1,2,...,N
ꢀꢀꢀꢀꢀꢀ
(1)其中s
i
(t)表示第i个噪声信号;s(t)表示原始信号;ε表示噪声标准差;ω
i
(t)表示白噪声序列;N表示测试次数;2)、对噪声信号进行EMD分解,对分解结果进行平均,得到第一内涵模态分量:其中表示第j个模式组件;N表示测试次数;IMF
1i
表示第i次测试得到的IMF;3)、计算第一个剩余分量:其中r1(t)表示第一个剩余分量;s(t)表示原始信号;表示第1个模式组件;4)、分解获得第二个模式:其中表示第二个模式组件;N表示测试次数;E
k
(
·
)表示生成通过EMD分解获得的
第k个模式的运算符;r1(t)表示第一个剩余分量;ε1E表示噪声标准差;ω
i
(t)表示白噪声序列;5)、计算j=2,3,

,j的第j个余数:其中r
j
(t)表示第j个剩余分量;r
j
‑1(t)表示第j

1个剩余分量;表示第j个模式组件;6)、对r
j
(t)+ε
j
E
j

i
(t)]进行分解得到(j+1)阶模态:其中表示第j+1个模式组件;N表示测试次数;E
k
(
·
)表示生成通过EMD分解获得的第k个模式的运算符;r
j
(t)表示第j个剩余分量;ε
j
表示噪声标准差;ω
i
(t)表示白噪声序列;7)重复步骤5)和6),直到剩余分量不能进一步分解,最后,将原始信号分解为:其中s(t)表示原始信号;J表示模式组件数量;表示第j个模式组件;R表示最终剩余分量。6.根据权利要求1所述的基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法,其特征在于,所述对频率最高的分解数据再次模态分解,得到再分解数据,具体为:对频率最高的内涵模态分量采用变分模态分解进一步分解,分解个数K采用归一化距离进行测算,并得到K个模态分量。7.根据权利要求6所述的基于多尺度特征提取和深度学习的PM
2.5
浓度预测方法,其特征在于,所述再次模态分解,具体为:构造变分问题(1)应用Hilbert变换计算各模态的解析信号u
k
,得到其单侧频谱:其中δ(t)表示狄拉克分布;t是时间脚本;j2=

1;*表示卷积算子;u
k
(t)为各模态的解析信号;(2)通过将分析信号乘以估计的中心频率将每个模式分量的频谱移到基带:其中δ(t)表示狄拉克分布;t是时间脚本;j2=

1;*表示卷积算子;u
k
(t)为各模态的解析信号;ω
k
表示第k个分解模式u
k

【专利技术属性】
技术研发人员:张晋董良
申请(专利权)人:暨南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1