一种大气污染在线识别方法技术

技术编号:36508597 阅读:20 留言:0更新日期:2023-02-01 15:35
本发明专利技术涉及数据识别技术领域,具体涉及一种大气污染在线识别方法。方法包括:通过对获取的污染信息、环境信息和空气质量评价的分析,采用自适应聚类半径的聚类算法,同时考虑簇内样本分布、簇间分布和污染信息与空气质量评价的变化相似性,从多个聚类原则对聚类过程进行调整。根据最终聚类效果获取环境信息对空气质量评价的影响程度,对待识别采集点直接获取的信息进行调整,获得最终获取空气质量评价,进而对实时空气情况数据进行分析,得到准确的、真实的大气污染在线识别效果。本发明专利技术通过准确地获取环境信息对空气质量评价的影响程度,进而获得最终获取空气质量评价,提高对实时空气情况数据分析的精确,能够得到准确的大气污染在线识别效果。大气污染在线识别效果。大气污染在线识别效果。

【技术实现步骤摘要】
一种大气污染在线识别方法


[0001]本专利技术涉及数据识别
,具体涉及一种大气污染在线识别方法。

技术介绍

[0002]大气污染是由于人类活动或自然过程引起某些物质进入大气中,呈现出足够的浓度,达到足够的时间,并因此危害了自然环境、人体舒适和人体健康的现象。大气污染物由人为源或者天然源进入大气,并参与大气的循环过程。大气污染物在大气中滞留一段时间之后,又通过大气中的化学反应、生物活动和物理沉降从大气中去除。如果输出大气污染物的速率小于输入大气污染物的速率,大气污染物就会在大气环境中相对集聚,造成大气中某种大气污染物的浓度升高。当大气污染物浓度升高到一定程度时,就会直接或间接地对人、生物或材料等造成急性、慢性危害。
[0003]现有技术中,检测大气污染的方法大多仅为使用空气质量检测传感器获取空气中各项指标的成分,需要海量的大气污染数据和地理数据,建立复杂的仿真模型,对数据的离散值和缺失值较为敏感,通过仿真模型识别出异常数据。但是大气中各种各项指标在不同区域以及不同高度位置的传感器获取的数据也是不一定的,即不同环境信息和不同传感器信息对所获取的空气质量评价不同,因此直接根据采集到的数据对最终空气质量评价进行识别会受到环境信息的影响,导致最终识别结果不准确。

技术实现思路

[0004]为了解决上述技术问题,本专利技术的目的在于提供一种大气污染在线识别方法,所采用的技术方案具体如下:本专利技术提出了一种大气污染在线识别方法,所述方法包括:获得每个采集点的污染信息、至少两种环境信息和空气质量评价;根据所述污染信息和所述环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇;根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标;根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标;确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性;根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标;改变所述初始聚类过程中的聚类半径,根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径;利用所述最优聚类半径根据采集点的所述初始聚类距离对采集点进行聚类,得到至少两个第一聚类簇;任选一个目标环境信息,在初始聚类距离获取过程中去除所述目标环境信息,获得最终聚类距离,并进行聚类,得到至少两个第二聚类簇;根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取所述目标环境信息对空气质量评价的影响程度;根据所述待识别采集点对应的每个所述环境信息的影响程度调整所述待识别采
集点的实时空气质量评价,获得最终空气质量评价,确定所述待识别采集点的大气污染情况。
[0005]进一步地,所述根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标,包括:获取各个所述聚类簇内每个样本与对应聚类簇中心之间的第一污染信息差异距离,所述第一污染信息差异距离的累加和作为第一聚类效果评价指标。
[0006]进一步地,所述根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标,包括:获取各个所述聚类簇内的污染信息与所有所述聚类簇对应的污染信息均值之间的第二污染信息差异距离,所述二污染信息差异距离的累加和作为第二聚类效果评价指标。
[0007]进一步地,所述确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性的方法包括:根据每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式获得所述变化相似性,所述每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式为:其中,表示所述污染信息的各个指标与空气质量评价的相关性,表示所述预设邻域时段的时间长度,表示第个所述采集点的所述污染信息,表示第个所述采集点的所述污染信息对应的所述空气质量评价,为修正系数。
[0008]进一步地,所述根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标包括:所述第三聚类效果评价指标的公式为:其中,表示所述污染信息的第三聚类效果评价指标,表示所述聚类簇的数量,表示以自然常数为底的指数函数,表示所述污染信息与空气质量评价的变化相关性,表示在第个所述聚类簇对应的所述污染信息的方差。
[0009]进一步地,所述根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径,包括:根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效
果评价指标获得综合聚类效果评价指标;污染信息的所述第一聚类效果评价指标和所述第三聚类效果评价指标与综合聚类效果评价指标呈负相关关系;污染信息的所述第二聚类效果评价指标与综合聚类效果评价指标呈正相关关系;根据所述综合聚类效果评价指标的数值确定所述最优聚类半径。
[0010]进一步地,所述根据所述综合聚类效果评价指标的数值确定所述最优聚类半径包括:若所述综合聚类效果评价指标大于预设指标阈值,则取所述综合聚类效果评价指标对应的所述聚类半径作为所述最优聚类半径;若所述综合聚类效果评价指标不大于所述预设指标阈值,则增大所述聚类半径继续对所述污染信息和所述环境信息进行聚类,直至对应的所述综合聚类效果评价指大于所述预设指标阈值。
[0011]进一步地,所述每个采集点的污染信息和环境信息包括:每个所述采集点的污染信息包括一氧化碳含量、二氧化硫含量、、二氧化碳含量和一氧化氮含量;每个所述采集点的环境信息包括时间信息、环境风速和坐标位置。
[0012]进一步地,所述根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取环境信息对空气质量评价的影响程度,包括:获取所述待识别采集点所属的所述第一聚类簇和第二聚类簇中空气质量评价均值的差值绝对值,以所述差值绝对值作为所述目标环境信息对空气质量评价的影响程度;所述影响程度包括:时间信息对空气质量评价的第一影响程度、环境风速对空气质量评价的第二影响程度和坐标位置对空气质量评价的第三影响程度。
[0013]进一步地,确定最终空气质量评价包括:根据最终空气质量评价公式获得所述最终空气质量评价,所述最终空气质量评价公式为:其中,表示所述最终空气质量评价,表示所述待识别采集点的采集传感器的数量,表示所述第一影响程度,表示所述第二影响程度,表示所述第三影响程度,表示待识别采集点的环境风速,表示所述待识别采集点在采集传感器处的实时空气质量评价。
[0014]本专利技术具有如下有益效果:本专利技术实施例通过对获取的污染信息、环境信息和空气质量评价的分析,采用自适应聚类半径的聚类算法,同时考虑簇内样本分布、簇间分布和污染信息与空气质量评价的变化相似性,从多个聚类原则对聚类过程进行调整,能够增强环境信息对空气质量评价的影响程度的获取准确性,能够保证最终获取的聚类效果,方便后续环境信息对空气质量评价的影响程度的获取。根据最终聚类效果获取环境信息对空气质量评价的影响程度,能
够多方面、多维度综合分析待识别采集点的空气质量情况,通过对应的影本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大气污染在线识别方法,其特征在于,该方法包括以下步骤:获得每个采集点的污染信息、至少两种环境信息和空气质量评价;根据所述污染信息和所述环境信息获得不同采集点的初始聚类距离,并进行初始聚类,得到至少两个聚类簇;根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标;根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标;确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性;根据所述变化相似性和各个所述聚类簇中污染信息的分布离散程度获得第三聚类效果评价指标;改变所述初始聚类过程中的聚类半径,根据所述第一聚类效果评价指标、所述第二聚类效果评价指标和所述第三聚类效果评价指标确定最优聚类半径;利用所述最优聚类半径根据采集点的所述初始聚类距离对采集点进行聚类,得到至少两个第一聚类簇;任选一个目标环境信息,在初始聚类距离获取过程中去除所述目标环境信息,获得最终聚类距离,并进行聚类,得到至少两个第二聚类簇;根据待识别采集点所属的第一聚类簇和第二聚类簇对应的空气质量评价差异获取所述目标环境信息对空气质量评价的影响程度;根据所述待识别采集点对应的每个所述环境信息的影响程度调整所述待识别采集点的实时空气质量评价,获得最终空气质量评价,确定所述待识别采集点的大气污染情况。2.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述根据各个所述聚类簇中样本的分布离散程度获得第一聚类效果评价指标,包括:获取各个所述聚类簇内每个样本与对应聚类簇中心之间的第一污染信息差异距离,所述第一污染信息差异距离的累加和作为第一聚类效果评价指标。3.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述根据整体所述聚类簇的分布离散程度获得第二聚类效果评价指标,包括:获取各个所述聚类簇内的污染信息与所有所述聚类簇对应的污染信息均值之间的第二污染信息差异距离,所述二污染信息差异距离的累加和作为第二聚类效果评价指标。4.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述确定每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性的方法包括:根据每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式获得所述变化相似性,所述每个采集点在预设邻域时段内的污染信息与空气质量评价的变化相似性公式为:其中,表示所述污染信息的各个指标与空气质量评价的相关性,表示所述预设邻域时段的时间长度,表示第个所述采集点的所述污染信息,表示第个所述采集点的所述污染信息对应的所述空气质量评价,为修正系数。5.根据权利要求1所述的一种大气污染在线识别方法,其特征在于,所述根据所述变化
相似性和各个所述聚类簇中污染信息的分布离散程...

【专利技术属性】
技术研发人员:高飞刘旗龙曹磊吕婧王雨薇张淳李毅辉陈浩杏艳陈静牛天田王琼赵万年赵佳奇
申请(专利权)人:陕西省环境监测中心站
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1