【技术实现步骤摘要】
空气质量监测站大气观测缺失数据的反演方法及系统
[0001]本专利技术涉及缺失数据反演
,特别是涉及一种空气质量监测站大气观测缺失数据的反演方法及系统。
技术介绍
[0002]近年来,中国在全国各地建立了多个空气质量监测站,构成了国家环境空气质量监测网,但由于不同区域的监测站建成时间不一致,或者站点因特殊的情况而迁移、重建,或者监测仪器故障等,导致历史监测数据的缺失或不连续,严重影响了对大气污染物的长期变化趋势的分析。
[0003]有研究直接采用站点之间大气观测数据进行数据缺失时间段补齐的方法,或采用线性回归订正站点之间的大气观测数据,但这些都不满足站点之间观测数据的非线性关系。不少研究提出采用空气污染建模方法反演和评估大气污染,例如有物理模式、分散模式和统计模式,特别是物理模式中的化学传输模式(WRF
‑
Chem、CMAQ等)在近些年很流行,该模式需要输入实时更新的排放源清单、气象情况、土地利用和地形等信息,但是传统的模式难以准确分析污染物浓度、排放源、气象、土地利用和地形的非线性关系,造成
【技术保护点】
【技术特征摘要】
1.一种空气质量监测站大气观测缺失数据的反演方法,其特征在于,包括:对于环境空气质量监测网中间隔设定距离的两个空气质量监测站,分别获取第一个空气质量监测站以及第二个空气质量监测站在设定时间段内的大气观测数据,得到第一观测数据集和第二观测数据集;在所述设定时间段内,两个空气质量监测站大气观测数据均未缺失;以所述第一观测数据集为输入,以所述第二观测数据集为输出对机器学习模型进行训练和验证得到第二个空气质量监测站的最佳机器学习模型;以所述第二观测数据集为输入,以所述第一观测数据集为输出对机器学习模型进行训练和验证得到第一个空气质量监测站的最佳机器学习模型;将第二个空气质量监测站在第一目标时间段内的大气观测数据输入所述第一个空气质量监测站的最佳机器学习模型中,得到所述第一个空气质量监测站大气观测缺失数据;所述第一目标时间段为所述第一个空气质量监测站大气观测缺失数据对应的时间段;将第一个空气质量监测站在第二目标时间段内的大气观测数据输入所述第二个空气质量监测站的最佳机器学习模型中得到所述第二个空气质量监测站大气观测缺失数据;所述第二目标时间段为所述第二个空气质量监测站大气观测缺失数据对应的时间段。2.根据权利要求1所述的空气质量监测站大气观测缺失数据的反演方法,其特征在于,所述以所述第一观测数据集为输入,以所述第二观测数据集为输出对机器学习模型进行训练和验证得到第二个空气质量监测站的最佳机器学习模型,具体包括:将所述第一观测数据集按比例分为第一训练数据集和第一验证数据集;将所述第二观测数据集按比例分为第二训练数据集和第二验证数据集;以所述第一训练数据集为输入,以所述第二训练数据集为输出,对机器学习模型进行训练得到第二个空气质量监测站的训练机器学习模型;以所述第一验证数据集为输入,以所述第二验证数据集为输出,对所述第二个空气质量监测站的训练机器学习模型进行验证得到第二个空气质量监测站的最佳机器学习模型。3.根据权利要求1所述的空气质量监测站大气观测缺失数据的反演方法,其特征在于,所述以所述第二观测数据集为输入,以所述第一观测数据集为输出对机器学习模型进行训练和验证得到第一个空气质量监测站的最佳机器学习模型,具体包括:将所述第一观测数据集按比例分为第一训练数据集和第一验证数据集;将所述第二观测数据集按比例分为第二训练数据集和第二验证数据集;以所述第二训练数据集为输入,以所述第一训练数据集为输出,对机器学习模型进行训练得到第一个空气质量监测站的训练机器学习模型;以所述第二验证数据集为输入,以所述第一验证数据集为输出,对所述第一个空气质量监测站的训练机器学习模型进行验证得到第一个空气质量监测站的最佳机器学习模型。4.根据权利要求1所述的空气质量监测站大气观测缺失数据的反演方法,其特征在于,所述机器学习模型为:提升树、神经网络、随机森林或K近邻算法模型。5.一种空气质量监测站大气观测缺失数据的反演系统,其特征在于,包括:获取模块,用于对于环境空气质量监测网中间隔设定距离的两个空气质量监测站,分...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。