近地表痕量气体浓度反演模型及反演方法技术

技术编号:35813833 阅读:12 留言:0更新日期:2022-12-03 13:36
一种近地表痕量气体浓度反演模型及基于该模型反演地表痕量气体浓度的方法,反演模型基于遥感数据与站点数据建立反演模型。通过如下步骤建立反演模型,S1,收集地表监测数据、遥感数据、气象数据和其他数据;S2,对步骤S1收集的数据进行预处理,得到预处理后的初始建模数据;S3,对初始建模数据进行特征筛选,得到建模数据集;S4,根据建模数据集搭建模型。反演模型建立后,可通过该模型反演地表痕量气体浓度。本发明专利技术结合人工智能与大数据挖掘与技术,建立遥感监测的痕量气体总柱浓度与地面站点监测的痕量气体质量浓度的反演模型,能够准确、高效地反演近地表痕量气体的时空分布特征,支撑大气污染物防治工作的精准实施。大气污染物防治工作的精准实施。大气污染物防治工作的精准实施。

【技术实现步骤摘要】
近地表痕量气体浓度反演模型及反演方法


[0001]本专利技术涉及气象信息
,特别是涉及一种近地表痕量气体浓度反演模型及通过该模型反演近地 表痕量气体浓度分布的方法。

技术介绍

[0002]痕量气体包括O3、NO2、SO2、CO。目前痕量气体的监测手段主要为地面监测和遥感监测。其中地面监 测主要有地面监测站点的自动监测、手动取样监测和走航监测,优点是监测的时间频率和精度均较高,缺 点是地面监测站点分布不均匀,监测结果覆盖范围小(只能满足监测站点周围区域),建设和维护成本高, 无法满足区域化大尺度痕量气体浓度实时且准确监控的需求;遥感监测能周期性、重复地从空中乃至宇宙 空间对大范围区域进行对地观测,解决了地面站点覆盖范围小的缺点,但目前的遥感技术针对痕量气体只 能提供不同垂直范围内的总柱浓度、对流层柱浓度或痕量气体剖面产品,针对颗粒物只能提供气溶胶光学 厚度产品,不能提供近地表痕量气体的浓度。
[0003]因此,针对现有技术不足,提供一种能准确、高效地反演近地表痕量气体的时空分布特征的近地表痕 量气体浓度反演模型及通过该模型反演近地表痕量气体浓度分布的方法以克服现有技术不足甚为必要。

技术实现思路

[0004]本专利技术的目的在于避免现有技术的不足之处而提供一种近地表痕量气体浓度反演模型及通过该模型 反演近地表痕量气体浓度分布的方法,能够准确、高效地反演近地表痕量气体的时空分布特征特别是浓 度特征。
[0005]本专利技术的目的通过以下技术措施实现。
[0006]提供一种近地表痕量气体浓度反演模型,基于遥感数据与站点数据建立反演模型。结合人工智能与大 数据挖掘与技术,建立遥感监测的痕量气体总柱浓度(以下简称“遥感数据”)与地面站点监测的痕量气 体质量浓度(以下简称“站点数据”)的回归模型(反演模型),准确、高效地反演近地表痕量气体的时空 分布特征,支撑大气污染物防治工作的精准实施。
[0007]可选的,上述的近地表痕量气体浓度反演模型,通过如下步骤建立:
[0008]S1,收集地表监测数据、遥感数据、气象数据和其他数据;
[0009]S2,对步骤S1收集的数据进行预处理,得到预处理后的初始建模数据;
[0010]S3,对初始建模数据进行特征筛选,得到建模数据集;
[0011]S4,根据建模数据集搭建模型。
[0012]3.根据权利要求2所述的近地表痕量气体浓度反演模型,其特征在于:S1中,收集地表监测数据具体 是:
[0013]从地方省级环境监测中心站获取地表痕量气体浓度数据,包括O3、NO2、CO、SO2的小时值、8小时均 值和24小时均值,痕量气体使用13:00和14:00的算数平均值,数据中包含了
监测站点的经度、纬度和 日期;
[0014]收集遥感数据具体是:
[0015]痕量气体遥感数据使用的是哨兵5P的L2级总柱浓度产品数据,遥感数据从Google Earth Engine(GEE) 平台上下载;
[0016]收集气象数据具体是:
[0017]气象数据从省级气象局获取,气象条件监测站点密集且分布均匀,平均1km2范围内的站点数大于1个, 气象类型包括平均温度(TEM_Avg)、最大温度(TEM_Max)、最小温度(TEM_Min)、平均相对湿度(RH)、 8:00

8:00累积降雨量(PRE_08)、20:00

20:00累积降雨量(PRE_20)、2分钟平均风速(WIN)、蒸发量(EVP)、 日照时数(SSH),全部为日均值数据;
[0018]收集其他数据具体是:
[0019]其他用到的数据有数字高程模型(DEM),空间分辨率为30m
×
30m;地表覆盖类型数据(GLC),空间分 辨率为30m
×
30m,人口密度数据(PopDen),空间分辨率0.09
°×
0.09
°

[0020]痕量气体具有空间和时间上异质性,将日期数据转化为每年的第几天(DOY),匹配时间异质性,用监 测站点的经纬度(Lon/Lat)匹配空间异质性。
[0021]可选的,上述的近地表痕量气体浓度反演模型,对步骤S1收集的数据进行预处理的具体过程是:
[0022]S21,数据提取
[0023]首先,从空气质量监测的原始文件中提取2018年

2020年目标城市群所有空气质量监测站点的痕量气 体13:00

14:00的监测结果,删除缺失值后,将每天13:00和14:00的监测结果求算术平均值,作为 地面监测结果,得到痕量气体监测数据集。提取过程中同时包含监测站点的经度、纬度和监测日值,根据 监测站点的经度和纬度信息转化为WGS

84坐标系下的点矢量文件,简称“痕量气体点矢量”,用于提取对 应监测站点的气象数据、地理数据、人口密度数据;
[0024]其次,将GEE下载的遥感数据重投影至WGS84坐标系,使用最近邻采样方法重采样至1km
×
1km的分 辨率,使用痕量气体点矢量提取对应点位的遥感数据,得到遥感数据集;
[0025]再次,从气象数据原始文件中提取2018

2020年所有监测站点的日均值监测结果,包含气象监测站点 的经纬度和日期,剔除所有缺失值,依次按照日期和气象数据字段信息,按照经纬度和监测结果将各个气 象字段的监测数据转化为WGS

84坐标系下的点矢量文件,然后按照反距离权重插值方法插值到1km
×
1km 分辨率,进一步矢量转栅格后形成栅格文件,栅格文件的像元值就是气象字段的日均值监测结果,最后使 用痕量气体点矢量提取对每天各字段对应位置的气象结果,得到气象数据集;
[0026]最后,DEM、GLC、PopDen均为栅格文件,其中DEM和GLC分辨率为30m
×
30m,PopDen分辨率为900m
×
900m, 使用最近邻采样方法重采样至1km
×
1km,重投影至WGS

84坐标系下,使用痕量气体矢量提取,得到辅助 数据集;
[0027]S22,数据结合
[0028]数据提取阶段共提取了4个数据集,分别为痕量气体的监测数据集、遥感数据集、气象数据集、辅助 数据集,四份数据集中均包含有经度、纬度和日期,按照这三个字段将四份数据结合成为最终的数据集, 简称“原始数据集”,进一步将原始数据集中的日期转化为每年的第几天,Day Of Year(DOY),原始数据 集中痕量气体的监测结果为标签,其余全部
为特征;
[0029]S23.异常值剔除
[0030]对原始数据集进行异常值检查,检查异常值的方法是绘制箱型图,将含有异常值的样本全部删除;此外,根据先验知识将气象数据的异常值(如WIN>50m/s,TEM_Avg>本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种近地表痕量气体浓度反演模型,其特征在于:基于遥感数据与站点数据建立反演模型。2.根据权利要求1所述的近地表痕量气体浓度反演模型,其特征在于:通过如下步骤建立:S1,收集地表监测数据、遥感数据、气象数据和其他数据;S2,对步骤S1收集的数据进行预处理,得到预处理后的初始建模数据;S3,对初始建模数据进行特征筛选,得到建模数据集;S4,根据建模数据集搭建模型。3.根据权利要求2所述的近地表痕量气体浓度反演模型,其特征在于:S1中,收集地表监测数据具体是:从地方省级环境监测中心站获取地表痕量气体浓度数据,包括O3、NO2、CO、SO2的小时值、8小时均值和24小时均值,痕量气体使用13:00和14:00的算数平均值,数据中包含了监测站点的经度、纬度和日期;收集遥感数据具体是:痕量气体遥感数据使用的是哨兵5P的L2级总柱浓度产品数据,遥感数据从Google Earth Engine(GEE)平台上下载;收集气象数据具体是:气象数据从省级气象局获取,气象条件监测站点密集且分布均匀,平均1km2范围内的站点数大于1个,气象类型包括平均温度(TEM_Avg)、最大温度(TEM_Max)、最小温度(TEM_Min)、平均相对湿度(RH)、8:00

8:00累积降雨量(PRE_08)、20:00

20:00累积降雨量(PRE_20)、2分钟平均风速(WIN)、蒸发量(EVP)、日照时数(SSH),全部为日均值数据;收集其他数据具体是:其他用到的数据有数字高程模型(DEM),空间分辨率为30m
×
30m;地表覆盖类型数据(GLC),空间分辨率为30m
×
30m,人口密度数据(PopDen),空间分辨率0.09
°×
0.09
°
;痕量气体具有空间和时间上异质性,将日期数据转化为每年的第几天(DOY),匹配时间异质性,用监测站点的经纬度(Lon/Lat)匹配空间异质性。4.根据权利要求3所述的近地表痕量气体浓度反演模型,其特征在于:S1中:对步骤S1收集的数据进行预处理的具体过程是:S21,数据提取首先,从空气质量监测的原始文件中提取2018年

2020年目标城市群所有空气质量监测站点的痕量气体13:00

14:00的监测结果,删除缺失值后,将每天13:00和14:00的监测结果求算术平均值,作为地面监测结果,得到痕量气体监测数据集。提取过程中同时包含监测站点的经度、纬度和监测日值,根据监测站点的经度和纬度信息转化为WGS

84坐标系下的点矢量文件,简称“痕量气体点矢量”,用于提取对应监测站点的气象数据、地理数据、人口密度数据;其次,将GEE下载的遥感数据重投影至WGS84坐标系,使用最近邻采样方法重采样至1km
×
1km的分辨率,使用痕量气体点矢量提取对应点位的遥感数据,得到遥感数据集;再次,从气象数据原始文件中提取2018

2020年所有监测站点的日均值监测结果,包含气象监测站点的经纬度和日期,剔除所有缺失值,依次按照日期和气象数据字段信息,按照
经纬度和监测结果将各个气象字段的监测数据转化为WGS

84坐标系下的点矢量文件,然后按照反距离权重插值方法插值到1km
×
1km分辨率,进一步矢量转栅格后形成栅格文件,栅格文件的像元值就是气象字段的日均值监测结果,最后使用痕量气体点矢量提取对每天各字段对应位置的气象结果,得到气象数据集;最后,DEM、GLC、PopDen均为栅格文件,其中DEM和GLC分辨率为30m
×
30m,PopDen分辨率为900m
×
900m,使用最近邻采样方法重采样至1km
×
1km,重投影至WGS

84坐标系下,使用痕量气体矢量提取,得到辅助数据集;S22,数据结合数据提取阶段共提取了4个数据集,分别为痕量气体的监测数据集、遥感数据集、气象数据集、辅助数据集,四份数据集中均包含有经度、纬度和日期,按照这三个字段将四份数据结合成为最终的数据集,简称“原始数据集”,进一步将原始数据集中的日期转化为每年的第几天,Day Of Year(DOY),原始数据集中痕量气体的监测结果为标签,其余全部为特征;S23.异常值剔除对原始数据集进行异常值检查,检查异常值的方法是绘制箱型图,将含有异常值的样本全部删除;此外,根据先验知识将气象数据的异常值(如WIN>50m/s,TEM_Avg>40℃,SSH>24h)剔除,即删除极端天气的影响,同样将含有极端天气的样本删除。5.根据权利要求4所述的近地表痕量气体浓度反演模型,其特征在于:S1中:S3中对初始建模数据进行特征筛选,具体包括:S31.绘制散点图研究相关关系通过绘制散点图的方式,研究数据集中各特征变量与痕量气体之间的相关关系,数据中包含长时间序列、大范围的气体,散点图可以有效反应痕量气体与其他特征之间的相关关系,根据先验知识将基本无相关的特征删除;S32.统计person相关系数和p_value通过统计特征之间的person相关系数,痕量气体与其他变量之间相关性,将person相关系数为0.00的特征删除,进一步计算p_value值,将p_value<0.01的变量删除;S33.机器学习筛选特征将步骤S31、S32筛选后的数据集带入随机森林模型,使用该模型的内建函数“feature.importance”计算特征重要性,排序后按照特征重要性得分由小到大排序,依次删除得分较小的特征,查看建模精度变化,直到模型精度发生较大变化时停止删除特征,得到建模数据集,简称“数据集”。6.根据权利要求5所述的近地表痕量气体浓度反演模型,其特征在于:S1中:S4搭建模型建模使用的机器学习算法为eXtreme Gradient Boosting(XG...

【专利技术属性】
技术研发人员:吝路军刘静杨震刘慧娟董思源王政伟韩勇秦杰英杨静静韦云鹏李玟吕婧曹磊高飞张霖琳张淳陈静李毅辉葛毅
申请(专利权)人:陕西省环境监测中心站
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1