System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度置信网络的区域空气质量预测方法技术_技高网

一种基于深度置信网络的区域空气质量预测方法技术

技术编号:41207546 阅读:3 留言:0更新日期:2024-05-09 23:28
本发明专利技术涉及一种基于深度置信网络的区域空气质量预测方法。该方法首先对监测点位空气质量监测数据即6种空气污染物小时浓度数据进行清洗,填充缺失并归一化,生成训练集和测试集,然后将数据输入到IPSO‑DBN模型中进行特征提取,使用Attention机制将不同点位监测数据提取出的特征进行加权融合,将融合后的特征向量作为SVR模型的输入进行模型的训练,最后使用训练好的模型进行6种空气污染物小时浓度的预测。该方法融合了DBN模型强大的特征提取能力和SVR模型的回归预测能力以及Attention机制解决空气质量空间相关性,提高模型的预测准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术属于深度学习,具体地说是一种基于深度置信网络的区域空气质量预测方法


技术介绍

1、近年来,空气污染对人类健康的危害愈发严重,人们也愈加关注空气质量问题。据世界卫生组织(who)估计,每年因空气污染可造成700万人过早死亡,除常见的心血管和呼吸道疾病外,有新证据表示空气污染还会引起糖尿病和神经退行性疾病等问题,是人类健康面临的最大环境威胁之一。如今,117个国家的6000多个城市正在监测空气质量,与2011年启动空气质量数据库时相比,报告数量增加了近6倍。在监测的基础上,进行空气质量预测有助于政府制定相关决策、为民众提供出行依据,对城市规划建设、环境管理、污染控制等具有重要意义。

2、空气质量预测的主要方法是数值模拟和统计学习。数值模拟依据大气物理、大气化学等大气环境基础理论,使用高斯模型、拉格朗日模型等作为内核,以气象场为驱动,构建模拟真实大气环境来预测空气质量。大气作为一个混沌系统,对其进行模拟难度高,模型庞大复杂且计算量巨大,导致实际应用中该方法受到限制。统计学习以回归、分类、拟合等算法为内核,以历史数据为驱动,通过寻找数据变化规律、挖掘输入输出关系来预测污染物浓度。随着神经网络技术发展迅速,深度学习模型逐渐成为空气质量预测领域的研究热点,与传统的统计预测方法相比,其强大的学习能力无疑是巨大的优势,能够处理更多的数据特征,得到更好的预测效果,因此,本文提出一种基于深度置信网络的区域空气质量预测方法。


技术实现思路

1、为了加强对大气监测点位空气质量监测数据的分析预测能力,充分发挥深度学习在空气质量预测领域的作用,本专利技术提出一种基于深度置信网络的区域空气质量预测方法。本专利技术将空气污染物浓度作为模型的输入,采用基于改进粒子群算法优化深度信念网络(ipso-dbn)模型提取数据特征,使用attention机制融合若干点位的特征,将融合得到的全局特征输入到svr模型,输出预测的污染物浓度结果。

2、本专利技术为实现上述目的所采用的技术方案是:

3、一种基于深度置信网络的区域空气质量预测方法,包括以下步骤:

4、1)从大气自动监测点位获取空气质量监测数据;

5、2)对空气质量监测数据中的污染物浓度数据进行数据清洗,并将数据划分为训练集和测试集;

6、3)对污染物浓度训练数据集进行预处理,得到输入向量;

7、4)把每个点位的输入向量分别输入到ipso-dbn模型进行特征提取,使用注意力机制把不同点位监测数据的特征向量进行加权融合,得到全局特征;

8、5)将全局特征输入到svr模型进行训练;

9、6)使用步骤4)和步骤5)中训练好的dbn-attention-svr组合模型进行预测,将模型预测结果反归一化并输出,得到预测的未来一小时的污染物浓度。

10、所述数据清洗具体为:将数据中的浓度负值、字母标识的异常值置nan,视为缺失;然后使用三次样条插值法进行缺失值填充,对于连续6小时及以上的数据缺失不进行插值填充。

11、所述预处理为对污染物浓度训练数据集进行归一化。

12、所述ipso-dbn模型包括深度置信网络dbn以及使用粒子群算法,通过使用粒子群算法对dbn的初始权值进行优化,完成对数据的特征提取。

13、所述dbn使用堆叠的多层rbm对输入数据抽象、提取特征信息,通过最小化能量函数对其进行训练,rbm的能量函数为:

14、

15、其中,θ={wij,ai,bj}表示dbn模型参数,其中wij是可见层神经元i与隐藏层神经元j之间的连接权重,ai表示可见层神经元i的偏置值,bj表示隐藏层神经元j的偏置值,vi为可见层神经元i的状态,hj为隐藏层神经元j的状态。

16、所述粒子群算法的粒子速度和位置更新公式为:

17、

18、其中,k为迭代次数,和分别表示第i个粒子第k次迭代的位置和速度,pibest是个体极值,pgbest是全局极值,r1和r2为(0,1)之间的随机数,w为惯性权重,c1,c2为学习因子。

19、所述粒子群算法还需要对学习因子c1,c2以及惯性权重w进行动态调整,具体为:

20、

21、其中,kmax为最大迭代次数,wmax为惯性权重最大值,wmin为惯性权重最小值,c1max为学习因子c1最大值,c1min为学习因子c1最小值,c2max为学习因子c2最大值,c2min为学习因子c2最小值,k为当前迭代,w、c1、c2为第k代的惯性权重和学习因子。

22、所述使用注意力机制把不同点位监测数据的特征向量进行加权融合,具体为:

23、

24、

25、

26、其中,hi表示第i个站点的空气质量数据特征,si为第i个站点的数据特征得分,和bα为计算得分所用的参数,sn表示计算权重时对所有站点得分遍历求和,αi为与第i个站点的加权权重,c为注意力机制最终得到的全局特征。

27、所述svr模型具体为:

28、使用径向基核函数将特征数据从低维空间映射到高维空间,在高维空间中寻找最优超平面,使最远样本点离超平面的距离最小,设置容忍偏差ε,当svr模型输出f(x)和y的误差绝对值大于ε时才计算损失,同时引入松弛变量,使部分样本不在2ε间隔带内,svr目标函数为:

29、

30、

31、其中,ω为超平面权值向量,b为偏置,xi为第i个样本数据即第i条全局特征,为核函数,yi为第i条特征对应的真实输出,c为惩罚因子,ξi、分别为间隔带上方和下方样本点的松弛变量,对于任意样本xi,如果在间隔带内,ξi、都为0;在间隔带上方ξi>0,在间隔带下方ξi=0,

32、一种基于深度置信网络的区域空气质量预测装置,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现所述的一种基于深度置信网络的区域空气质量预测方法。

33、本专利技术具有以下有益效果及优点:

34、1.本专利技术为空气质量预测提供一种切实有效的方法,能够较为准确的预测出未来一小时的空气污染物浓度,为空气污染的治理提供了有效的技术支撑。

35、2.本专利技术以沈阳市34个大气自动监测点位的6种空气污染物小时浓度数据作为输入向量,充分发挥了ipso-dbn强大的特征提取能力和svr的回归预测能力,并结合注意力机制降低模型的预测误差。

本文档来自技高网...

【技术保护点】

1.一种基于深度置信网络的区域空气质量预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述数据清洗具体为:将数据中的浓度负值、字母标识的异常值置NAN,视为缺失;然后使用三次样条插值法进行缺失值填充,对于连续6小时及以上的数据缺失不进行插值填充。

3.根据权利要求1所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述预处理为对污染物浓度训练数据集进行归一化。

4.根据权利要求1所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述IPSO-DBN模型包括深度置信网络DBN以及使用粒子群算法,通过使用粒子群算法对DBN的初始权值进行优化,完成对数据的特征提取。

5.根据权利要求4所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述DBN使用堆叠的多层RBM对输入数据抽象、提取特征信息,通过最小化能量函数对其进行训练,RBM的能量函数为:

6.根据权利要求4所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述粒子群算法的粒子速度和位置更新公式为:

7.根据权利要求6所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述粒子群算法还需要对学习因子c1,c2以及惯性权重w进行动态调整,具体为:

8.根据权利要求1所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述使用注意力机制把不同点位监测数据的特征向量进行加权融合,具体为:

9.根据权利要求1所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述SVR模型具体为:

10.一种基于深度置信网络的区域空气质量预测装置,其特征在于,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1-9任一项所述的一种基于深度置信网络的区域空气质量预测方法。

...

【技术特征摘要】

1.一种基于深度置信网络的区域空气质量预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述数据清洗具体为:将数据中的浓度负值、字母标识的异常值置nan,视为缺失;然后使用三次样条插值法进行缺失值填充,对于连续6小时及以上的数据缺失不进行插值填充。

3.根据权利要求1所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述预处理为对污染物浓度训练数据集进行归一化。

4.根据权利要求1所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述ipso-dbn模型包括深度置信网络dbn以及使用粒子群算法,通过使用粒子群算法对dbn的初始权值进行优化,完成对数据的特征提取。

5.根据权利要求4所述的一种基于深度置信网络的区域空气质量预测方法,其特征在于,所述dbn使用堆叠的多层rbm对输入数据抽象、提取特征信息,通过最小化能量函...

【专利技术属性】
技术研发人员:白雪张哲王宁周晓磊祁柏林张镝徐凯
申请(专利权)人:中国科学院沈阳计算技术研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1