System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于大气表观反射率的PM2.5浓度估算方法技术_技高网
当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于大气表观反射率的PM2.5浓度估算方法技术

技术编号:41133217 阅读:4 留言:0更新日期:2024-04-30 18:03
本发明专利技术公开了一种基于大气表观反射率的PM<subgt;2.5</subgt;浓度估算方法,该属于大气遥感技术领域。首先,搜集PM<subgt;2.5</subgt;站点观测数据,卫星数据等多源数据,然后整理这些数据,统一空间分辨率,并构建样本数据集。然后基于LightGBM模型和SHAP理论,仅对卫星数据的光谱和角度波段进行特征重要性排序,筛选关键的特征波段。随后,将关键特征波段,气象资料,地表覆盖数据等辅助数据作为新提出的立体空间和时间LightGBM模型的输入数据,并优化模型参数,训练高精度的PM<subgt;2.5</subgt;反演模型。最后将所有特征数据的栅格文件输入到训练好的立体空间和时间LightGBM模型,反演最终的PM<subgt;2.5</subgt;浓度结果图。本发明专利技术优化了PM<subgt;2.5</subgt;反演框架,有助于开展大气环境健康的评估与研究等应用。

【技术实现步骤摘要】

本专利技术属于大气遥感,具体涉及一种基于大气表观反射率的pm2.5浓度估算方法。


技术介绍

1、细颗粒物(pm2.5)作为主要的大气污染物之一,对公众健康构成极大威胁。这些微小颗粒能够穿透血液,导致心血管疾病、呼吸系统疾病和其他健康问题。然而,中国大气污染物监测站的分布稀疏,东部和西部地区之间存在较大的区域差异。因此,迫切需要对pm2.5进行全面、高分辨率的监测,以有效解决这一问题。这种监测工作对于捕捉空气污染动态、开展环境健康影响研究以及为制定有效的清洁空气政策、保护公众健康和支持可持续社会发展提供科学见解至关重要。

2、机器学习模型可以直接学习大气顶部反射率(toa)和pm2.5之间的关系,然而,根据toa数据估算的pm2.5存在一些问题。首先,由于蓝、红、短波红外波段在aod检索中的应用较为普遍,因此在以往的方法中普遍采用蓝、红、短波红外波段作为输入参数。尽管一些方法尝试用不同波段的组合来提高pm2.5的检索精度,但对引入这些波段的具体物理意义的深入探索在很大程度上仍未得到解决。此外,pm2.5的时空分布受自然动态和人为活动的双重影响,具有明显的时空异质性。然而,现有方法缺乏将高程信息整合到这些时空模型中的思考,目前主要集中在二维空间考虑。这些研究往往将高程数据在模型制定过程中视为自变量,从而忽略了立体空间属性的整合。

3、针对上述问题,本专利技术提出了一种新的立体空间和时间lightgbm模型(sstlg),用于反演pm2.5浓度。该方法通过沙普利解释(shap)来解释机器学习模型,提取与pm2.5反演的关键toa特征波段,随后采用sstlg模型,结合气象数据,地表覆盖数据等其他辅助数据,实现对pm2.5的高精度反演。


技术实现思路

1、1.要解决的技术问题

2、本专利技术的目的在于提供一种基于大气表观反射率的pm2.5浓度估算方法,以解决上述
技术介绍
中提出的问题:

3、如何选用与pm2.5相关联的toa波段;如何考虑立体空间和时间信息以实现pm2.5浓度高精度反演。

4、2.技术方案

5、一种基于大气表观反射率的pm2.5浓度估算方法,包括以下步骤:

6、s1、获取目标研究区的pm2.5监测站点数据和模型变量数据:模型变量数据包括卫星遥感数据(即大气表观数据toa及其角度数据),气象数据,地表覆盖数据和其他辅助数据;

7、s2、对模型变量数据进行预处理:利用空间数据处理手段对变量数据进行重采样至统一空间分辨率大小的栅格数据文件格式;

8、s3、构建样本数据集:根据pm2.5监测站点的地理坐标和时间,提取对应所有模型变量数据的特征值,全部组合成样本数据集;

9、s4、使用机器学习可解释方法对卫星遥感数据提取关键特征,其具体实施包括以下子步骤:

10、s4.1、仅利用样本数据集中的pm2.5监测数据和大气表观数据toa及其角度数据,通过lightgbm模型进行训练,构建pm2.5反演模型;

11、s4.2、通过沙普利加性解释方法(shapley additive explanations,shap)对模型进行解释,计算大气表观数据和对应角度数据的特征重要性;

12、s4.3、根据特征重要性的排序,由大到小选择前n个特征作为pm2.5反演的关键特征;

13、s5、构建sstlg(立体空间和时间lightgbm,stereoscopic spatial and temporallightgbm)模型:该模型是在lightgbm模型的基础之上,融合了立体空间信息和时间信息。其中立体空间信息通过地理坐标数据和海拔高度数据转换得到,时间信息数据通过年积日数据转换得到;

14、s6、对s5中构建sstlg模型进行训练:从样本数据集中将pm2.5监测站点数据作为目标变量,将s4中得到的关键特征数据,气象数据,地表覆盖数据和其他辅助数据作为输入特征变量进行训练;

15、s7、浓度估算:基于训练好的sstlg模型,将s4中得到的关键特征数据,气象数据,地表覆盖数据和其他辅助数据的栅格文件作为数据输入,估算pm2.5浓度。

16、优选地,s1中所述卫星遥感数据包括例如modis系列卫星数据,landsat系列卫星数据,fengyun-4卫星数据等多光谱卫星数据1级产品(即原始的大气表观产品),本专利技术选取modis影像中的大气表观产品(mod021km)为pm2.5浓度估算做数据准备。

17、优选地,s1中所述气象数据包括边界层高度blh,蒸散发et,2m高气温tem,降水pre,相对湿度rh,地表大气压sp,10m高经度方向风u10,10m高纬度方向风v10。数据来源包括但不限于欧洲中期天气预报中心再分析数据集(era5),中国区域地面气象要素驱动数据集等,本专利技术选取era5数据集为pm2.5浓度估算做数据准备。

18、优选地,s1中所述地表覆盖数据包括归一化植被指数ndvi数据,土地覆盖类型lucc数据。ndvi数据来源包括但不限于mod13产品,基于landsat卫星红波段和红外波段计算的数据等。土地覆盖类型数据来源包括但不限于mcd12产品,欧空局的esacci产品等。本专利技术选择mcd12产品为pm2.5浓度估算做数据准备。

19、优选地,s1中所述其他辅助数据是与pm2.5浓度存在关联的数据,包括但不限于夜间灯光数据,排放清单数据等。本专利技术选择viirs的夜间灯光数据为pm2.5浓度估算做数据准备。

20、优选地,s2中所述利用空间数据处理手段对变量数据进行重采样是通过地理信息系统软件或遥感数据处理软件如arcgis,envi等,或基于编程语言如python,matlab等进行批量处理。本专利技术基于python语言进行处理,将所有模型变量数据的空间分辨率统一为0.01度的栅格文件。

21、优选地,s4中所述对卫星遥感数据提取关键特征是为了减少数据维度,提高估算精度和效率,并非所有的光谱波段和角度波段都与pm2.5的反演过程存在关联。本专利技术选择的mod021km存在36个光谱波段,以及卫星还包括4个角度波段,需要先通过机器学习解释方法来计算各个特征波段的特征重要性,筛选与pm2.5反演更相关的数据。

22、优选地,s4.1中所述通过lightgbm模型进行训练是采用样本集中所有的pm2.5监测站点浓度数据,和所有对应的光谱波段数据和角度数据进行训练,构建模型,在这里不需要过度调整参数。本专利技术选择利用python语言上的lightgbm库进行模型训练。

23、优选地,s4.2中所述通过沙普利加性解释方法(shapley additiveexplanations,shap)对模型进行解释是指针对s4.1中训练好的lightgbm模型,计算每个样本每个特征的shap值,具体计算公式如下:

24、

25、式中,φi表示特征i的sha本文档来自技高网...

【技术保护点】

1.一种基于大气表观反射率的PM2.5浓度估算方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于大气表观反射率的PM2.5浓度估算方法,其特征在于,

3.根据权利要求1所述的一种基于大气表观反射率的PM2.5浓度估算方法,其特征在于:S2中所述利用空间数据处理手段对变量数据进行重采样具体是指通过地理信息系统软件或遥感数据处理软件,或基于编程语言对变量数据进行批量处理;所述地理信息系统软件或遥感数据处理软件包括但不限于ArcGIS,ENVI;所述编程语言包括但不限于Python,Matlab。

4.根据权利要求1所述的一种基于大气表观反射率的PM2.5浓度估算方法,其特征在于:S3中所述构建样本数据集是指通过ArcGIS软件或Python语言,根据PM2.5的监测站点地理坐标和时间,提取模型变量栅格文件中对应时间、对应像元位置的特征值,一一对应组合成样本数据,存储为csv或其他表格形式文件。

5.根据权利要求1所述的一种基于大气表观反射率的PM2.5浓度估算方法,其特征在于:S4.1中所述通过LightGBM模型进行训练具体指采用样本集中所有的PM2.5监测站点浓度数据,和所有对应的光谱波段数据和角度数据进行训练,构建模型。

6.根据权利要求1所述的一种基于大气表观反射率的PM2.5浓度估算方法,其特征在于:S4.2中所述通过沙普利加性解释方法对模型进行解释是指针对S4.1中训练好的LightGBM模型,计算每个样本每个特征的SHAP值,具体计算公式如下:

7.根据权利要求1所述的一种基于大气表观反射率的PM2.5浓度估算方法,其特征在于:S5中所述SSTLG模型的立体空间信息和时间信息数据通过以下公式进行计算:

8.根据权利要求1所述的一种基于大气表观反射率的PM2.5浓度估算方法,其特征在于:S6中所述模型训练过程采用网格搜索法或十折交叉验证法实现对模型参数的优化。

9.根据权利要求1所述的一种基于大气表观反射率的PM2.5浓度估算方法,其特征在于:S7中所述估算PM2.5浓度具体指将特征数据的栅格文件,转化为列表文件输入到SSTLG模型中,再将输出结果转化为空间数据,附上地理坐标信息,得到最终的PM2.5浓度估算图。

...

【技术特征摘要】

1.一种基于大气表观反射率的pm2.5浓度估算方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于大气表观反射率的pm2.5浓度估算方法,其特征在于,

3.根据权利要求1所述的一种基于大气表观反射率的pm2.5浓度估算方法,其特征在于:s2中所述利用空间数据处理手段对变量数据进行重采样具体是指通过地理信息系统软件或遥感数据处理软件,或基于编程语言对变量数据进行批量处理;所述地理信息系统软件或遥感数据处理软件包括但不限于arcgis,envi;所述编程语言包括但不限于python,matlab。

4.根据权利要求1所述的一种基于大气表观反射率的pm2.5浓度估算方法,其特征在于:s3中所述构建样本数据集是指通过arcgis软件或python语言,根据pm2.5的监测站点地理坐标和时间,提取模型变量栅格文件中对应时间、对应像元位置的特征值,一一对应组合成样本数据,存储为csv或其他表格形式文件。

5.根据权利要求1所述的一种基于大气表观反射率的pm2.5浓度估算方法,其特征在于:s4.1中所述通过lightgb...

【专利技术属性】
技术研发人员:王展鹏贾鹏李辰秦坤冯静怡刘一希徐文婷
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1