当前位置: 首页 > 专利查询>南通大学专利>正文

一种基于多源数据和神经网络模型的PM2.5反演方法技术

技术编号:25803360 阅读:26 留言:0更新日期:2020-09-29 18:37
本发明专利技术公开了一种基于多源数据和神经网络模型的PM2.5反演方法,获取Landsat 8影像数据,PM2.5监测数据,气象数据,高程数据和城市特征数据;提取Landsat 8影像特征及其衍生特征;提取风速、温度、降水和相对湿度等与PM2.5具有相关性的气象特征;提取地形特征以及工厂密度、道路密度、人口密度和人均GDP等城市特征;搭建神经网络模型,对数据集进行训练;对模型进行优化;使用反演模型得到PM2.5反演结果;利用逐小时气象数据实时更新反演结果并利用逐小时空气质量数据对反演结果进行纠偏。本发明专利技术能够较准确的反演出PM2.5实时浓度,得到PM2.5的空间分布规律,为需要高精度PM2.5分布数据的研究提供基础数据。

【技术实现步骤摘要】
一种基于多源数据和神经网络模型的PM2.5反演方法
本专利技术具体涉及一种基于多源数据和神经网络模型反演PM2.5的反演方法。
技术介绍
近年来PM2.5成为人们重点关注的大气污染物之一,其输送距离远,在空气中停留时间长,会对人体和环境造成不良影响,研究表明长期暴露于PM2.5污染中将严重危害人体的健康。避开高污染区是减少威胁的有效方法,但有效避开高污染区的路线选择需要高时间精度、大范围、高质量的PM2.5分布数据做支撑。当前已有PM2.5监测站,但其分布稀疏且集中在城市建成区,数据分布不均匀且精度低,近年来利用覆盖范围广的遥感影像和其他数据的多源数据PM2.5反演方法快速发展。中分辨率成像光谱仪(MODIS)AOD、多角度成像光谱仪(MISR)AOD、可见红外成像辐射计(VIIRS)AOD等是当前常用的遥感影像产品。然而这些影像的分辨率较低,PM2.5反演结果精度受限。AOD产品是结合影像通过算法获得的,误差累计的风险比直接使用影像数据要高。目前使用的多源数据有气象、土地利用类型、人口密度等等,表征人类活动的数据较少,然而人类活动与大气质量之间有着密切的联系。现有利用遥感影像反演地面PM2.5浓度的方法有线性回归模型、线性混合模型以及神经网络等。线性回归模型和线性混合模型忽略了空间异质性,在下垫面情况复杂的情况下,模型不能正确反映污染物浓度。如果不对多源数据进行处理,无论哪种方法都容易出现过拟合的情况。
技术实现思路
专利技术目的:鉴于上述问题,本专利技术的目的是提供一种基于多源数据和神经网络模型的PM2.5反演方法,以解决应用高级统计模型和低精度遥感影像反演PM2.5时存在精度较低的问题。技术方案:为解决上述技术问题,本专利技术所采用的技术方案是:一种基于多源数据和神经网络模型的PM2.5反演方法,包括如下步骤:步骤一:获取Landsat8影像数据,PM2.5监测数据,气象数据,高程数据和城市特征数据;步骤二:提取Landsat8影像特征及其衍生特征;步骤三:提取风速、温度、降水和相对湿度与PM2.5具有相关性的气象特征;步骤四:提取地形特征以及工厂密度、道路密度、人口密度和人均GDP等城市特征;步骤五:搭建神经网络模型,对数据集进行训练;步骤六:根据留出法的验证结果对模型进行优化;步骤七:使用反演模型得到PM2.5反演结果;步骤八:利用逐小时气象数据实时更新反演结果并利用逐小时空气质量数据对反演结果进行纠偏。进一步的,所述的步骤一中的气象数据包括风速、相对湿度、温度、和降水量;城市特征数据包括工厂和道路分布数据、人均GDP和人口密度栅格图。进一步的,所述的步骤二具体为:2.1对Landsat8遥感影像进行辐射校正、大气校正、去云的预处理;2.2提取Landsat8影像数据的红光波段反射率R和蓝光波段反射率B;2.3提取影像成像的月份M;2.4根据如下公式计算NDVI:其中,NIR为近红外波段反射率,R为红光波段反射率。进一步的,所述的步骤三具体为:3.1构建气象站点的泰森多边形,将落入各泰森多边形中的PM2.5监测站点与各多边形对应的气象站点匹配;3.2提取PM2.5监测站点对应的气象站当天和前一天的数据。进一步的,所述的步骤四具体为:4.1在每个栅格像元中心的一定范围内定义一个邻域area,将邻域内点的数量相加,得到count,然后除以邻域面积,即得到工厂的密度Df;4.2定义一个领域半径R,以栅格像元中心为圆心,绘制半径为R的邻域,计算线状要素落入该邻域的长度之和L,并与该邻域面积πR2相除,得到道路密度Dr;4.3提取站点周围30m的平距高程H,平均工厂密度Daf和平均道路密度Dar;4.4从人口密度和人均GDP的栅格图像中提取监测站点的人口密度Dpop和人均GDP数据GDPa。进一步的,所述的步骤五具体为:5.1对多源数据进行主成分分析,保留主成分;5.2搭建多层感知器神经网络模型,输入保留数据集进行训练;5.3通过以下四种方法对模型进行优化:①增加或减少隐藏层的层数与每层所包含的神经元的个数;②添加Dropout层并使用正则化,防止出现过拟合的情况;③调整迭代次数,确定最优解情况下的大致迭代次数;④调整模型的学习率,学习率太小会导致训练速度过慢或者出现局部最优解,学习率太大可能会导致模型错过最优解,需要根据具体训练情况来确定。进一步的,所述的步骤六中留出法验证模型精度具体为对数据集进行划分,将80%作为训练集进行训练,20%作为测试集进行验证。进一步的,所述的步骤七中使用反演模型的到PM2.5反演结果的具体步骤为反演结果与真实值的相关系数较大,平均绝对误差较小时得出反演模型;将待反演影像所对应的主成分数据输入到模型中得到该天的PM2.5反演结果。进一步的,所述的步骤八中具体步骤为:8.1按照多源数据的时间分辨率更新多源数据,如气象数据的更新速率可以达到每小时一次,数据更新后可获得新的PM2.5反演结果;8.2构建PM2.5监测站点的泰森多边形,计算落如泰森多边形的像元的平均PM2.5浓度每小时计算一次监测站点PM2.5浓度Cz与泰森多边形内像元的平均PM2.5浓度的差值Δc即8.3使用Cn=C+Δc公式对泰森多边形内像元的PM2.5浓度C进行每小时一次的调整得到新的PM2.5浓度Cn。有益效果:本专利技术首先获取Landsat8影像数据,PM2.5监测数据,气象数据,高程数据和城市特征数据;提取遥感影像波段信息和成像月份并计算归一化植被指数(NDVI);提取影像成像当天与前一天的气象数据和当天的PM2.5浓度;然后提取高程和城市特征;接着搭建神经网络模型,对以上的数据进行训练;基于“留出法”对模型精度进行验证,并根据验证结果对模型参数进行修改,以达到最优效果;综上得到PM2.5反演模型;最后基于多源数据,并利用监测站逐小时PM2.5数据更新调整反演结果,在研究区空间范围内实现PM2.5的实时计算。本专利技术提供的一种高精度的PM2.5反演方法能够较准确的反演出PM2.5实时浓度,得到PM2.5的空间分布规律,其中预测值和真实值的相关性高达0.89,时间分辨率达1小时,空间分辨率达30m*30m,可以为一些需要高精度PM2.5分布数据的研究提供基础数据。附图说明图1为本专利技术的基于多源数据和神经网络模型的PM2.5反演方法实施例的流程图;图2为本专利技术实施例的气象站点和PM2.5站点匹配示意图;图3为本专利技术实施例的工厂的密度Df示意图;图4为本专利技术实施例的主要道路的密度Dr示意图;图5为本专利技术实施例的反演结果示意图。具体实施方式下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,以使本领域的技术人员能够更好的理解本专利技术的优点和特征,从而对本专利技术的保护范围做出更为清楚的界定本文档来自技高网...

【技术保护点】
1.一种基于多源数据和神经网络模型的PM2.5反演方法,其特征在于,包括如下步骤:/n步骤一:获取Landsat 8影像数据,PM2.5监测数据,气象数据,高程数据和城市特征数据;/n步骤二:提取Landsat 8影像特征及其衍生特征;/n步骤三:提取风速、温度、降水和相对湿度与PM2.5具有相关性的气象特征;/n步骤四:提取地形特征以及工厂密度、道路密度、人口密度和人均GDP等城市特征;/n步骤五:搭建神经网络模型,对数据集进行训练;/n步骤六:根据留出法的验证结果对模型进行优化;/n步骤七:使用反演模型得到PM2.5反演结果;/n步骤八:利用逐小时气象数据实时更新反演结果并利用逐小时空气质量数据对反演结果进行纠偏。/n

【技术特征摘要】
1.一种基于多源数据和神经网络模型的PM2.5反演方法,其特征在于,包括如下步骤:
步骤一:获取Landsat8影像数据,PM2.5监测数据,气象数据,高程数据和城市特征数据;
步骤二:提取Landsat8影像特征及其衍生特征;
步骤三:提取风速、温度、降水和相对湿度与PM2.5具有相关性的气象特征;
步骤四:提取地形特征以及工厂密度、道路密度、人口密度和人均GDP等城市特征;
步骤五:搭建神经网络模型,对数据集进行训练;
步骤六:根据留出法的验证结果对模型进行优化;
步骤七:使用反演模型得到PM2.5反演结果;
步骤八:利用逐小时气象数据实时更新反演结果并利用逐小时空气质量数据对反演结果进行纠偏。


2.根据权利要求1所述的基于多源数据和神经网络模型的PM2.5反演方法,其特征在于,所述的步骤一中的气象数据包括风速、相对湿度、温度、和降水量;城市特征数据包括工厂和道路分布数据、人均GDP和人口密度栅格图。


3.根据权利要求1所述的基于多源数据和神经网络模型的PM2.5反演方法,其特征在于,所述的步骤二具体为:
2.1对Landsat8遥感影像进行辐射校正、大气校正、去云的预处理;
2.2提取Landsat8影像数据的红光波段反射率R和蓝光波段反射率B;
2.3提取影像成像的月份M;
2.4根据如下公式计算NDVI:



其中,NIR为近红外波段反射率,R为红光波段反射率。


4.根据权利要求1所述的基于多源数据和神经网络模型的PM2.5反演方法,其特征在于,所述的步骤三具体为:
3.1构建气象站点的泰森多边形,将落入各泰森多边形中的PM2.5监测站点与各多边形对应的气象站点匹配;
3.2提取PM2.5监测站点对应的气象站当天和前一天的数据。


5.根据权利要求1所述的基于多源数据和神经网络模型的PM2.5反演方法,其特征在于,所述的步骤四具体为:
4.1在每个栅格像元中心的一定范围内定义一个邻域area,将邻域内点的数量相加,得到count,然后除以邻域面积,即得到工厂的密度Df;
4.2定义一个领域半径R,以栅格像元中心为圆心...

【专利技术属性】
技术研发人员:高丽娜闫金伟陶菲王辰怡张帅倩孔薇周侗
申请(专利权)人:南通大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1