The invention discloses an air quality anomaly detection method based on distributed online principal component analysis. Obtain the known air pollutant concentration data of the city, design the distributed on-line principal component analysis model, adopt the method based on the distributed on-line principal component analysis model to process the air pollutant concentration data and obtain the judgment result, then carry on the abnormal detection to the air quality. The invention can conveniently predict the overall air quality in a certain range, restrain the influence of abnormal training data, play a role of noise removal, process faster and use shorter time.
【技术实现步骤摘要】
一种基于分布式在线主成分分析的空气质量异常检测方法
本专利技术属于分布式信号处理、机器学习以及异常检测领域,特别是涉及一种基于分布式在线主成分分析的空气质量异常检测方法。
技术介绍
主成分分析(PrincipalComponentAnalysis,简称PCA)是一种常用的无监督降维方法。通过PCA能够得到数据分布的主要方向。常规的PCA通过构造数据协方差矩阵并计算其特征向量来实现主成分分析过程。这些特征向量是原始数据空间中含信息量较多的方向,因此被视为主要成分或主要方向。对于常规的PCA而言,一般需要获得全部的原始数据,生成原始数据的协方差矩阵。显然主成分分析方法可以应用于异常检测领域,通过分析得到训练数据的主要成分,然后根据主要成分判断测试数据是否异常。在实际中,用于异常检测的数据可以通过无线传感器网络(wirelesssensornetworks,简称WSNs)来进行采集。例如,利用气体传感器组成的传感器网络测量空气中污染物的浓度。一般来说,衡量空气质量的主要指标是空气中主要污染物,即SO2、NO2、CO、PM10、PM2.5和O3的浓度。可以通过气体传感器分散地测量空气中各个污染物的浓度,然后通过合理的计算确定最终的空气质量。在这种情况下,数据是分散地被多个传感器节点采集的,因此常规PCA利用数据协方差矩阵求解主成分的方法显然是不太合适的。
技术实现思路
本专利技术的目的在于针对数据是分布式采集的这样一种实际情况,提出一种基于分布式在线主成分分析的空气质量异常检测方法,通过不需要数据协方差矩阵的分布式在线主成分分析方法进行空气质量数据的异常检测。如图1所 ...
【技术保护点】
1.一种基于分布式在线主成分分析的空气质量异常检测方法,其特征在于包括以下几个步骤:(1)获取城市的已知空气污染物浓度数据;(2)设计分布式在线主成分分析模型;(3)采用基于分布式在线主成分分析模型的空气质量异常检测方法对空气污染物浓度数据进行处理获得判断结果,从而对空气质量进行异常检测。
【技术特征摘要】
1.一种基于分布式在线主成分分析的空气质量异常检测方法,其特征在于包括以下几个步骤:(1)获取城市的已知空气污染物浓度数据;(2)设计分布式在线主成分分析模型;(3)采用基于分布式在线主成分分析模型的空气质量异常检测方法对空气污染物浓度数据进行处理获得判断结果,从而对空气质量进行异常检测。2.根据权利要求1所述的一种基于分布式在线主成分分析的空气质量异常检测方法,其特征在于:所述步骤(1)的城市的已知空气污染物浓度数据是包括某一城市在某一时间段内的每日多地点空气污染物浓度数据。3.根据权利要求1所述的基于分布式在线主成分分析的空气质量异常检测方法,其特征在于:所述的空气污染物浓度数据是由传感器网络采集获得的,传感器网络是由分布于不同地点的传感器节点用无线/有线方式互相连接而组成,每两个传感器节点具有直接/间接通信连接关系,每个传感器节点采集获得各自监测范围的空气污染物浓度数据。4.根据权利要求1所述的基于分布式在线主成分分析的空气质量异常检测方法,其特征在于:所述的步骤(2)具体建立以下公式表示的传感器节点的目标函数作为分布式在线主成分分析模型:s.t.WjTWj=I在这里,Wj表示当前时刻传感器节点j的特征矩阵,具体是由传感器节点j的p个主成分组成,表示Wj为d行p列的矩阵,j表示传感器网络中的传感器节点的序数,p表示传感器节点j的主成分总数,d表示传感器节点j的一个主成分的维度;Wj=[wj1,…,wjp],wj1表示传感器节点j的第1个主成分,wjp表示传感器节点j的第p个主成分;(Wjk-1)T表示传感器节点j在k-1时刻的特征矩阵的转置,表示传感器节点j在k-1时刻的第1个主成分;xjk表示传感器节点j在k时刻的空气污染物浓度数据,k≤t,表示xjk是d维列向量;fjt表示传感器节点j在t时刻的优化目标函数,表示传感器节点的集合,I是p行p列的单位矩阵。5.根据权利要求1所述的基于分布式在线主成分分析的空气质量异常检测方法,其特征在于:所述的步骤(3)具体是针对传感器节点采用以下方式计算获得:(3.1)先用已知空气污染物浓度数据处理获得各个传感器节点的最终特征矩阵:(3.1.1)针对每个传感器节点,利用拉格朗日乘子法并利用主成分单位正交的性质求解目标函数,获得每个时刻传感器节点获得的空气污染物浓度数据对应的主成分;具体采用以下公式计算传感器节点j在t时刻的第m主成分:式中,和表示传感器节点j在t时刻的第m主成分计算过程中的第一、第二中间变量,xjt表示传感器节点j在t时刻所采集到的空气污...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。