【技术实现步骤摘要】
近地表痕量气体浓度反演模型及反演方法
[0001]本专利技术涉及气象信息
,特别是涉及一种近地表痕量气体浓度反演模型及通过该模型反演近地 表痕量气体浓度分布的方法。
技术介绍
[0002]痕量气体包括O3、NO2、SO2、CO。目前痕量气体的监测手段主要为地面监测和遥感监测。其中地面监 测主要有地面监测站点的自动监测、手动取样监测和走航监测,优点是监测的时间频率和精度均较高,缺 点是地面监测站点分布不均匀,监测结果覆盖范围小(只能满足监测站点周围区域),建设和维护成本高, 无法满足区域化大尺度痕量气体浓度实时且准确监控的需求;遥感监测能周期性、重复地从空中乃至宇宙 空间对大范围区域进行对地观测,解决了地面站点覆盖范围小的缺点,但目前的遥感技术针对痕量气体只 能提供不同垂直范围内的总柱浓度、对流层柱浓度或痕量气体剖面产品,针对颗粒物只能提供气溶胶光学 厚度产品,不能提供近地表痕量气体的浓度。
[0003]因此,针对现有技术不足,提供一种能准确、高效地反演近地表痕量气体的时空分布特征的近地表痕 量气体浓度反演模型及通过该模型反演近地表痕量气体浓度分布的方法以克服现有技术不足甚为必要。
技术实现思路
[0004]本专利技术的目的在于避免现有技术的不足之处而提供一种近地表痕量气体浓度反演模型及通过该模型 反演近地表痕量气体浓度分布的方法,能够准确、高效地反演近地表痕量气体的时空分布特征特别是浓 度特征。
[0005]本专利技术的目的通过以下技术措施实现。
[0006]提供一种近地 ...
【技术保护点】
【技术特征摘要】
1.一种近地表痕量气体浓度反演模型,其特征在于:基于遥感数据与站点数据建立反演模型。2.根据权利要求1所述的近地表痕量气体浓度反演模型,其特征在于:通过如下步骤建立:S1,收集地表监测数据、遥感数据、气象数据和其他数据;S2,对步骤S1收集的数据进行预处理,得到预处理后的初始建模数据;S3,对初始建模数据进行特征筛选,得到建模数据集;S4,根据建模数据集搭建模型。3.根据权利要求2所述的近地表痕量气体浓度反演模型,其特征在于:S1中,收集地表监测数据具体是:从地方省级环境监测中心站获取地表痕量气体浓度数据,包括O3、NO2、CO、SO2的小时值、8小时均值和24小时均值,痕量气体使用13:00和14:00的算数平均值,数据中包含了监测站点的经度、纬度和日期;收集遥感数据具体是:痕量气体遥感数据使用的是哨兵5P的L2级总柱浓度产品数据,遥感数据从Google Earth Engine(GEE)平台上下载;收集气象数据具体是:气象数据从省级气象局获取,气象条件监测站点密集且分布均匀,平均1km2范围内的站点数大于1个,气象类型包括平均温度(TEM_Avg)、最大温度(TEM_Max)、最小温度(TEM_Min)、平均相对湿度(RH)、8:00
‑
8:00累积降雨量(PRE_08)、20:00
‑
20:00累积降雨量(PRE_20)、2分钟平均风速(WIN)、蒸发量(EVP)、日照时数(SSH),全部为日均值数据;收集其他数据具体是:其他用到的数据有数字高程模型(DEM),空间分辨率为30m
×
30m;地表覆盖类型数据(GLC),空间分辨率为30m
×
30m,人口密度数据(PopDen),空间分辨率0.09
°×
0.09
°
;痕量气体具有空间和时间上异质性,将日期数据转化为每年的第几天(DOY),匹配时间异质性,用监测站点的经纬度(Lon/Lat)匹配空间异质性。4.根据权利要求3所述的近地表痕量气体浓度反演模型,其特征在于:S1中:对步骤S1收集的数据进行预处理的具体过程是:S21,数据提取首先,从空气质量监测的原始文件中提取2018年
‑
2020年目标城市群所有空气质量监测站点的痕量气体13:00
‑
14:00的监测结果,删除缺失值后,将每天13:00和14:00的监测结果求算术平均值,作为地面监测结果,得到痕量气体监测数据集。提取过程中同时包含监测站点的经度、纬度和监测日值,根据监测站点的经度和纬度信息转化为WGS
‑
84坐标系下的点矢量文件,简称“痕量气体点矢量”,用于提取对应监测站点的气象数据、地理数据、人口密度数据;其次,将GEE下载的遥感数据重投影至WGS84坐标系,使用最近邻采样方法重采样至1km
×
1km的分辨率,使用痕量气体点矢量提取对应点位的遥感数据,得到遥感数据集;再次,从气象数据原始文件中提取2018
‑
2020年所有监测站点的日均值监测结果,包含气象监测站点的经纬度和日期,剔除所有缺失值,依次按照日期和气象数据字段信息,按照
经纬度和监测结果将各个气象字段的监测数据转化为WGS
‑
84坐标系下的点矢量文件,然后按照反距离权重插值方法插值到1km
×
1km分辨率,进一步矢量转栅格后形成栅格文件,栅格文件的像元值就是气象字段的日均值监测结果,最后使用痕量气体点矢量提取对每天各字段对应位置的气象结果,得到气象数据集;最后,DEM、GLC、PopDen均为栅格文件,其中DEM和GLC分辨率为30m
×
30m,PopDen分辨率为900m
×
900m,使用最近邻采样方法重采样至1km
×
1km,重投影至WGS
‑
84坐标系下,使用痕量气体矢量提取,得到辅助数据集;S22,数据结合数据提取阶段共提取了4个数据集,分别为痕量气体的监测数据集、遥感数据集、气象数据集、辅助数据集,四份数据集中均包含有经度、纬度和日期,按照这三个字段将四份数据结合成为最终的数据集,简称“原始数据集”,进一步将原始数据集中的日期转化为每年的第几天,Day Of Year(DOY),原始数据集中痕量气体的监测结果为标签,其余全部为特征;S23.异常值剔除对原始数据集进行异常值检查,检查异常值的方法是绘制箱型图,将含有异常值的样本全部删除;此外,根据先验知识将气象数据的异常值(如WIN>50m/s,TEM_Avg>40℃,SSH>24h)剔除,即删除极端天气的影响,同样将含有极端天气的样本删除。5.根据权利要求4所述的近地表痕量气体浓度反演模型,其特征在于:S1中:S3中对初始建模数据进行特征筛选,具体包括:S31.绘制散点图研究相关关系通过绘制散点图的方式,研究数据集中各特征变量与痕量气体之间的相关关系,数据中包含长时间序列、大范围的气体,散点图可以有效反应痕量气体与其他特征之间的相关关系,根据先验知识将基本无相关的特征删除;S32.统计person相关系数和p_value通过统计特征之间的person相关系数,痕量气体与其他变量之间相关性,将person相关系数为0.00的特征删除,进一步计算p_value值,将p_value<0.01的变量删除;S33.机器学习筛选特征将步骤S31、S32筛选后的数据集带入随机森林模型,使用该模型的内建函数“feature.importance”计算特征重要性,排序后按照特征重要性得分由小到大排序,依次删除得分较小的特征,查看建模精度变化,直到模型精度发生较大变化时停止删除特征,得到建模数据集,简称“数据集”。6.根据权利要求5所述的近地表痕量气体浓度反演模型,其特征在于:S1中:S4搭建模型建模使用的机器学习算法为eXtreme Gradient Boosting(XG...
【专利技术属性】
技术研发人员:吝路军,刘静,杨震,刘慧娟,董思源,王政伟,韩勇,秦杰英,杨静静,韦云鹏,李玟,吕婧,曹磊,高飞,张霖琳,张淳,陈静,李毅辉,葛毅,
申请(专利权)人:陕西省环境监测中心站,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。