空气污染物预测方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:37975585 阅读:10 留言:0更新日期:2023-06-30 09:50
本发明专利技术提供了一种空气污染物预测方法、装置、电子设备及可读存储介质,包括:当接收到当前时刻下的污染物数据时,从预先构建的数据仓库读取前一时刻下的每个候选空气污染物对应的污染物特征数据集;基于当前时刻下的污染物数据,和前一时刻下的每个候选空气污染物对应的污染物特征数据集,构建目标训练数据集;利用目标训练数据集对初始污染物预测模型进行训练,以得到目标污染物预测模型;通过目标污染物预测模型,基于当前时刻下的污染物数据进行污染物预测,以从候选空气污染物中确定当前时刻下的目标空气污染物。本发明专利技术可以显著提高空气污染物反演的精准性。空气污染物反演的精准性。空气污染物反演的精准性。

【技术实现步骤摘要】
空气污染物预测方法、装置、电子设备及可读存储介质


[0001]本专利技术涉及污染物反演
,尤其是涉及一种空气污染物预测方法、装置、电子设备及可读存储介质。

技术介绍

[0002]当前空气污染物(PM2.5\PM10\O3\SO2\CO\NO2)浓度数据获取的主要手段是从环境监测站点获取,环境监测站点的空气污染数据虽精确,但存在着建设与维护成本高、数量有限、空间分布不均衡且覆盖范围集中在城区等局限性,不能有效反映大尺度区域空气污染物的空间分布情况及跨境污染传输特征,而卫星遥感以其成本低、范围广、周期短、长期动态监测等优势,能够显著弥补地面监测站的不足,有效监测长时序、大范围的空气污染物的空间分布情况。
[0003]在相关技术手段提供了一种基于卫星遥感反演空气污染物,一般需要先反演AOD或者其他过程参数,实际上过程参数与空气污染物浓度在不同区域又呈现出不同的时空函数表现,增加了空气污染物反演中不可避免的误差传递与累积,导致空气污染物反演结果准确性较低。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种空气污染物预测方法、装置、电子设备及可读存储介质,可以显著提高空气污染物反演的精准性。
[0005]第一方面,本专利技术实施例提供了一种空气污染物预测方法,包括:当接收到当前时刻下的污染物数据时,从预先构建的数据仓库读取前一时刻下的每个候选空气污染物对应的污染物特征数据集;基于所述当前时刻下的所述污染物数据,和所述前一时刻下的每个所述候选空气污染物对应的污染物特征数据集,构建目标训练数据集;利用所述目标训练数据集对初始污染物预测模型进行训练,以得到目标污染物预测模型;通过所述目标污染物预测模型,基于所述当前时刻下的污染物数据进行污染物预测,以从所述候选空气污染物中确定所述当前时刻下的目标空气污染物。
[0006]在一种实施方式中,在从预先构建的数据仓库读取前一时刻下的每个候选空气污染物对应的污染物特征数据集之前,所述方法还包括:获取原始多源数据,并对所述多源数据进行预处理得到目标多源数据;其中,所述目标多源数据包括历史表观反射率、历史亮温数据、历史时空权重数据、历史气象要素数据、历史排放清单数据和历史地理特征数据;对所述目标多源数据进行空间匹配,以将所述目标多源数据划分为每个第一站点对应的多特征数据集;对于每个候选空气污染物,确定每个所述第一站点对应的所述多特征数据集相对
于该候选空气污染物的特征重要性,并基于所述特征重要性从每个所述第一站点对应的所述多特征数据集中确定该候选空气污染物对应的污染物特征数据集;基于每个所述候选空气污染物对应的所述污染物特征数据集搭建数据仓库。
[0007]在一种实施方式中,基于所述特征重要性从每个所述第一站点对应的所述多特征数据集中确定该候选空气污染物对应的污染物特征数据集,包括:对每个所述第一站点对应的所述特征重要性进行归一化处理,得到每个所述第一站点对应的归一化特征重要性;如果所述第一站点对应的所述归一化特征重要性大于预设重要性阈值,确定所述第一站点与该候选空气污染物关联,并将所述第一站点对应的所述多特征数据集,确定为该候选空气污染物对应的污染物特征数据集。
[0008]在一种实施方式中,基于所述当前时刻下的所述污染物数据,和所述前一时刻下的每个所述候选空气污染物对应的污染物特征数据集,构建目标训练数据集,包括:将所述当前时刻下的所述污染物数据,和所述前一时刻下的每个所述候选空气污染物对应的污染物特征数据集,合成为初始近实时训练数据集;根据所述初始近实时训练数据集的第一数据特征合成训练数据,并将所述训练数据合并至所述初始近实时训练数据集,得到目标近实时训练数据集;根据所述目标近实时训练数据集的第二数据特征,对所述数据仓库内存储的污染物特征数据集进行采样,得到采样训练数据集;将所述目标近实时训练数据集和所述采样训练数据集合成为目标训练数据集。
[0009]在一种实施方式中,基于所述初始近实时训练数据集的第一数据特征合成训练数据,包括:对所述初始近实时训练数据集进行空间匹配,以将所述初始近实时训练数据集划分为每个第二站点对应的子训练数据集;基于每个第二站点关联的候选空气污染物,统计所述子训练数据集中已发生污染的第一数据集数量和未发生污染的第二数据集数量,并将所述第一数据集数量和所述第二数据集数量之前的比例确定为不平衡度;其中,所述第一数据特征包括所述第一数据集数量和所述第二数据集数量;如果所述不平衡度小于预设不平衡度阈值,则基于已发生污染的子训练数据集与未发生污染的子训练数据集之间的欧式距离,确定已发生污染的目标待合成数据集数量;在已发生污染的子训练数据集中选择目标子训练数据集,并根据所述目标待合成数据集数量和所述目标子训练数据集合成训练数据。
[0010]在一种实施方式中,基于已发生污染的子训练数据集与未发生污染的子训练数据集之间的欧式距离,确定已发生污染的目标待合成数据集数量,包括:将所述第一数据集数量和所述第二数据集数量之间差值,与预设平衡系数之间的乘积,确定为初始待合成数据集数量;基于已发生污染的子训练数据集与未发生污染的子训练数据集之间的欧式距离,确定系数调节比例;将所述初始待合成数据集数量与所述系数调节比例之间的乘积,确定为定已发生污染的目标待合成数据集数量。
[0011]在一种实施方式中,根据所述目标近实时训练数据集的第二数据特征,对所述数据仓库内存储的污染物特征数据集进行采样,得到采样训练数据集,包括:对于每个所述候选空气污染物,如果所述目标近实时训练数据集中的第二站点关联该候选空气污染物,则确定所述第二站点关联的该候选空气污染物属于的污染等级;将属于所述污染等级的该候选空气污染物关联的第二站点的数量占所述第二站点总数量的比值,确定为该候选空气污染物及所述污染等级对应的采样比例;根据每个所述候选空气污染物及所述污染等级对应的所述采样比例,对所述数据仓库内存储的污染物特征数据集进行采样,得到采样训练数据集;其中,所述第二数据特征包括每个所述候选空气污染物及所述污染等级对应的所述采样比例。
[0012]在一种实施方式中,所述初始污染物预测模型为时空LightGBM模型;利用所述目标训练数据集对初始污染物预测模型进行训练,以得到目标污染物预测模型,包括:将所述目标训练数据集划分为第一数据集和第二数据集;将所述第一数据集作为所述时空LightGBM模型的输入,以及将所述第一数据集中每个第二站点关联的候选空气污染物作为真值,对所述时空LightGBM模型进行训练,且训练过程中逐一增加子模型,以对所述时空LightGBM模型中的每个所述子模型的参数进行调整;利用所述第二数据集对训练后的所述时空LightGBM模型进行验证;如果训练后的所述时空LightGBM模型满足预设指标,则将训练后的所述时空LightGBM模型确定为目标污染物预测模型。
[0013]第二方面,本专利技术实施例还提供一种空气污染物预测装置,包括:数据获取模块,用于当接收到当前时刻下的污染物数据时,从预先构建的数据仓库读取前一时刻下的每个候选空气本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种空气污染物预测方法,其特征在于,包括:当接收到当前时刻下的污染物数据时,从预先构建的数据仓库读取前一时刻下的每个候选空气污染物对应的污染物特征数据集;基于所述当前时刻下的所述污染物数据,和所述前一时刻下的每个所述候选空气污染物对应的污染物特征数据集,构建目标训练数据集;利用所述目标训练数据集对初始污染物预测模型进行训练,以得到目标污染物预测模型;通过所述目标污染物预测模型,基于所述当前时刻下的污染物数据进行污染物预测,以从所述候选空气污染物中确定所述当前时刻下的目标空气污染物。2.根据权利要求1所述的空气污染物预测方法,其特征在于,在从预先构建的数据仓库读取前一时刻下的每个候选空气污染物对应的污染物特征数据集之前,所述方法还包括:获取原始多源数据,并对所述多源数据进行预处理得到目标多源数据;其中,所述目标多源数据包括历史表观反射率、历史亮温数据、历史时空权重数据、历史气象要素数据、历史排放清单数据和历史地理特征数据;对所述目标多源数据进行空间匹配,以将所述目标多源数据划分为每个第一站点对应的多特征数据集;对于每个候选空气污染物,确定每个所述第一站点对应的所述多特征数据集相对于该候选空气污染物的特征重要性,并基于所述特征重要性从每个所述第一站点对应的所述多特征数据集中确定该候选空气污染物对应的污染物特征数据集;基于每个所述候选空气污染物对应的所述污染物特征数据集搭建数据仓库。3.根据权利要求2所述的空气污染物预测方法,其特征在于,基于所述特征重要性从每个所述第一站点对应的所述多特征数据集中确定该候选空气污染物对应的污染物特征数据集,包括:对每个所述第一站点对应的所述特征重要性进行归一化处理,得到每个所述第一站点对应的归一化特征重要性;如果所述第一站点对应的所述归一化特征重要性大于预设重要性阈值,确定所述第一站点与该候选空气污染物关联,并将所述第一站点对应的所述多特征数据集,确定为该候选空气污染物对应的污染物特征数据集。4.根据权利要求1所述的空气污染物预测方法,其特征在于,基于所述当前时刻下的所述污染物数据,和所述前一时刻下的每个所述候选空气污染物对应的污染物特征数据集,构建目标训练数据集,包括:将所述当前时刻下的所述污染物数据,和所述前一时刻下的每个所述候选空气污染物对应的污染物特征数据集,合成为初始近实时训练数据集;根据所述初始近实时训练数据集的第一数据特征合成训练数据,并将所述训练数据合并至所述初始近实时训练数据集,得到目标近实时训练数据集;根据所述目标近实时训练数据集的第二数据特征,对所述数据仓库内存储的污染物特征数据集进行采样,得到采样训练数据集;将所述目标近实时训练数据集和所述采样训练数据集合成为目标训练数据集。5.根据权利要求4所述的空气污染物预测方法,其特征在于,基于所述初始近实时训练
数据集的第一数据特征合成训练数据,包括:对所述初始近实时训练数据集进行空间匹配,以将所述初始近实时训练数据集划分为每个第二站点对应的子训练数据集;基于每个第二站点关联的候选空气污染物,统计所述子训练数据集中已发生污染的第一数据集数量和未发生污染的第二数据集数量,并将所述第一数据集数量和所述第二数据集数量之前的比例确定为不平衡度;其中,所述第一数据特征包括所述第一数据集数量和所述第二数据集数量;如果所述不平衡度小于预设不平衡度阈值,则基于已发生污染的子训练数据集与未发生污染的子训练数据集之间的欧式距离,确定已发生污染的目标待合成数据...

【专利技术属性】
技术研发人员:黄葵余永安李吉兵王宇翔
申请(专利权)人:航天宏图信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1