一种基于遥感和机器学习技术的PM制造技术

技术编号:36330849 阅读:58 留言:0更新日期:2023-01-14 17:40
本发明专利技术涉及遥感技术领域,具体为一种基于遥感和机器学习技术的PM

【技术实现步骤摘要】
一种基于遥感和机器学习技术的PM
2.5
反演方法


[0001]本专利技术涉及遥感
,尤其涉及基于遥感和机器学习技术的PM
2.5
反演方法。

技术介绍

[0002]全球疾病负担研究已将空气污染确定为所有死亡率的第五大风险因素, PM
2.5
的颗粒会对人体健康产生不利影响。随着经济的快速发展和城市化进程的加快,广泛存在的PM
2.5
污染已经引起了全世界的极大关注。
[0003]因此精确估计PM
2.5
的浓度对于污染防控和保护人民的生命健康尤为重要。但是大多数地区和国家仍然很少或没有PM
2.5
监测器,大约60%的国家没有常规的PM
2.5
监测,只有10%的国家每百万居民有3个以上的监测器,这阻碍了我们准确评估PM
2.5
污染对健康影响的能力。
[0004]气溶胶光学厚度(AOD)定义为垂直方向上消光系数的积分,是衡量气溶胶粒子太阳辐射吸收能力的重要无量纲参数。PM
2.5
、悬浮水汽等化学颗粒物是气溶胶的基本成分。AOD具有时空连续性,与垂直观测点对应的大气气溶胶粒子数有关,多项研究的统计描述也表明,AOD的数据分布与PM
2.5
相似。因此为了获取更广的空间覆盖度的空气污染状况,国内外学者提出了利用卫星影像获取的AOD产品来评估的方法,它能够补充空间和时间上的地面监测站点数据的不足,但是得到的产品依然存在时间分辨率低和空间分辨率低的问题。
[0005]早期研究使用简单线性回归模型或全球或大陆尺度的化学迁移模型(CTM) 获得了AOD和PM
2.5
的关系。后来学者们利用先进的统计模型证明了AOD和 PM
2.5
的关系在不同气象和土地覆盖类型因素下会发生改变,他们利用这些模型提高了PM
2.5
的估算精度。混合效应模型的提出为估算地面检测点密度不足的城市地区的PM
2.5
浓度提供了一个有效的工具。但是密集的地面监测网络和高分辨率的卫星数据产品才是提高PM
2.5
估算精度的关键性因素,通过稀疏的国家气象监测台站数据和低分辨率的遥感卫星产品难以获得高空间分辨率的PM
2.5
浓度数据。
[0006]密集的地面监测网络和高分辨率的卫星数据产品是提高PM
2.5
估算精度的关键性因素。因此,本方法除了利用稀疏的国家气象监测台站数据,还加入了区域气象监测台站数据,并结合气象要素数据、地形数据、路网数据以及卫星遥感数据,利用线性回归、支持向量机、随机森林机器学习技术建立混合效应模型,提高PM
2.5
估算精度。

技术实现思路

[0007](一)要解决的技术问题
[0008]本专利技术提供一种基于遥感和机器学习技术的PM
2.5
反演方法,可以通过机器学习技术,将PM
2.5
站点实测数据与遥感数据、气象数据和地形数据等多源数据建立关系模型,在保持原始测量精度的同时,提高了其空间覆盖范围。本技术方案充分考虑PM
2.5
的相关因子,可为大范围PM
2.5
数据的估算提供重要且可操作性强的参考依据。
[0009](二)技术方案
[0010]为解决上述问题,本专利技术提供一种基于遥感和机器学习技术的PM
2.5
反演方法,该方法包括以下步骤:步骤1、对气象站点数据、气象要素数据、地形数据、路网数据以及卫星遥感数据进行预处理;步骤2、地表参量的测定和分析,获取 PM
2.5
站点数据,光谱特征分析,寻找建模特征,将原始数据转化为特征,提高表示预测模型处理的实际问题的准确性;步骤3、建立模型,模型技术的选择和应用、模型训练、模型超参数设置和调整、模型验证、集成模型开发和测试、算法选择以及模型优化,结合PM
2.5
站点数据,实现PM
2.5
的反演模型构建;步骤4、评估模型的性能并建立基准,实验并调整运行中的模型,确定可以用于反演PM
2.5
的机器学习模型;步骤5、使用PM
2.5
反演模型以及各种观测数据实现 PM
2.5
的大面积实时估算。
[0011]优选地,步骤1的具体方法为:步骤1.1、对气象站点数据进行筛选,获得大湾区气象站点数据,并进行数据的清洗;步骤1.2、获取第五代ECMWF大气再分析全球气候数据(ERA5)的风速、湿度、压强、温度气象数据,进行数据提取和清洗等;步骤1.3、获取数字高程模型(DEM)数据,并对其进行数据的裁剪和清洗等;步骤1.4、获取路网数据(OSM)并对其进行裁剪和清洗等;步骤1.5、获取MODIS 16天合成的归一化植被指数(NDVI)产品与气溶胶光学厚度(AOD)日产品,对数据进行拼接、裁剪和数据清洗等。
[0012]优选地,步骤2的具体方法为:步骤2.1、对样本进行初步的简单分析,进行物理量之间的差异性研究,除用表格展现这些统计量之外,将采样点放置在矢量图上,在矢量数据上以柱状图或饼图显示出浓度的空间变化,进一步地对研究区域进行多角度划分,描述不同采样点的地表参数的变化;步骤2.2、获取 PM
2.5
站点数据对应的气象要素数据、地形数据、路网数据和卫星遥感数据,并将数据进行融合;步骤2.3、对获取到的多源数据进行二次清洗,剔除异常数据和重复数据,减少噪音并消除歧义;步骤2.4、对数据进行标准化等操作,其目的是提高后续建模的准确性;步骤2.5、将数据按一定的比例划分为训练集与测试集和验证集。
[0013]优选地,步骤3的具体方法为:步骤3.1、根据学习目标和数据要求选择正确的算法;步骤3.2、配置和调整超参数,并确定获得最佳超参数的迭代方法;步骤3.3、确定是否需要模型可解释性,确定模型的运行和部署要求;步骤3.4、利用不同机器学习算法对数据进行训练,获得PM
2.5
估算模型:
[0014]PM
2.5ij
~NDVI
ij
+AOD
ij
+t2m
ij
+sp
ij
+tp
ij
+u10
ij
+v10
ij
+DEM
ij
+OSM
ij
#(1)
[0015]式中,PM
2.5ii
为PM
2.5
预测估值,NDVI为归一化植被指数, AOD为气溶胶光学厚度,t2m为2米温度,sp为表面气压,tp为降雨量,u10为10米经度方向上风的分量,v10为10米纬度方向上风的分量, DEM为高程数据,OSM为路网数据;步骤3.5、评估结果模型以确定其是否满足业务和运营要求。
[0016]优选地,步骤4的具体方法为:步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于遥感和机器学习技术的PM
2.5
反演方法,其特征在于,该方法包括以下步骤:步骤1、对气象站点数据、气象要素数据、地形数据、路网数据以及卫星遥感数据进行预处理;步骤2、地表参量的测定和分析,获取PM
2.5
站点数据,光谱特征分析,寻找建模特征,将原始数据转化为特征,提高表示预测模型处理的实际问题的准确性;步骤3、建立模型,模型技术的选择和应用、模型训练、模型超参数设置和调整、模型验证、集成模型开发和测试、算法选择以及模型优化,结合PM
2.5
站点数据,实现PM
2.5
的反演模型构建;步骤4、评估模型的性能并建立基准,实验并调整运行中的模型,确定可以用于反演PM
2.5
的机器学习模型;步骤5、使用PM
2.5
反演模型以及各种观测数据实现PM
2.5
的大面积实时估算。2.根据权利要求1所述的基于遥感和机器学习技术的PM
2.5
反演方法,其特征在于,步骤1的具体方法为:步骤1.1、对气象站点数据进行筛选,获得大湾区气象站点数据,并进行数据的清洗;步骤1.2、获取第五代ECMWF大气再分析全球气候数据(ERA5)的风速、湿度、压强、温度等气象数据,进行数据提取和清洗等;步骤1.3、获取数字高程模型(DEM)数据,并对其进行数据的裁剪和清洗等;步骤1.4、获取路网数据(OSM)并对其进行裁剪和清洗等;步骤1.5、获取MODIS16天合成的归一化植被指数(NDVI)产品与气溶胶光学厚度(AOD)日产品,对数据进行拼接、裁剪和数据清洗等。3.根据权利要求1所述的基于遥感和机器学习技术的PM
2.5
反演方法,其特征在于,步骤2的具体方法为:步骤2.1、对样本进行初步的简单分析,进行物理量之间的差异性研究,除用表格展现这些统计量之外,将采样点放置在矢量图上,在矢量数据上以柱状图或饼图显示出浓度的空间变化,进一步地对研究区域进行多角度划分,描述不同采样点的地表参数的变化;步骤2.2、获取PM
2.5
站点数据对应的气象要素数据、地形数据、路网数据和卫星遥感数据,并将数据进行融合;步骤2.3、对获取到的多源数据进行二次清洗,剔除异常数据和重复数据,减少噪音并消除歧义;步骤2.4、对数据进行标准化等操作,其目的是提高后续建模的准确性;步骤2.5、将数据按一定的比例划分为训练集与测试集和验证集。4.根据权利要求1所述的基于遥...

【专利技术属性】
技术研发人员:王伟民熊向陨余良何伟彪梁鸿刘凯曾清怀许旺余欣繁尹淳阳文雯公莉张志刚李会亚俞兆康
申请(专利权)人:广东省深圳生态环境监测中心站广东省东江流域生态环境监测中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1