一种利用误差传递的空气质量数据实时校准方法技术

技术编号:17196021 阅读:40 留言:0更新日期:2018-02-03 22:45
本发明专利技术公开了一种利用误差传递的空气质量数据实时校准方法,其特征在于:首先初始化模型,然后采集最近时间段的国标数据和卓易设备数据,并对采集的国标数据进行克里金插值,得到采样频率与卓易设备相等的国标插值数据;其次,对国标插值数据及卓易设备数据进行基于Bagging模型的建模;接着,基于上次模型的误差,对本次Bagging模型输出的结果进行数据校准,得到校准值;最后等待最新国标数据的采集,并根据新采集的国标数据,来更新校准误差,并将误差传递给下一个模型。本方法通过对宜兴的实测数据进行模型验证,本方法能够有效的提高低精度设备的精度和准确率,能够进行区域部署,应用于实际生产环境。

【技术实现步骤摘要】
一种利用误差传递的空气质量数据实时校准方法
本专利技术属于空气质量数据实时校准方法
,具体涉及一种利用误差传递的空气质量数据实时校准方法。
技术介绍
随着我国工业化的发展,环境污染问题也日益严重。近年来,我国对环境问题逐步重视,我国环境污染程度逐步降低,但与发达国家相比仍差距很大。目前,监测空气环境质量是控制空气环境污染的一种有效手段。通过对工业区的空气质量进行实时监测,能够有效地监控企业的污染排放程度,严格控制空气质量环境。但是目前高精度高准确率的空气质量监测站使用的传感器成本较大,且实时性较低。江苏卓易信息科技股份有限公司自主研发了一种基于ARM架构的嵌入式设备(以下简称卓易设备),使用了成本和国家监测站相比较低的便携式传感器,能够准实时地监测空气环境质量。但是卓易设备精度和国家监测站相比较低,且准确率不高,存在一定的错误率。基于机器学习的设备校准方法能够有效地对设备进行校准,提高设备的精度和准确度。文献1[MaTT.P–Qdecoupledcontrolschemesusingfuzzyneuralnetworksfortheunifiedpowerflowcontroller[J].InternationalJournalofElectricalPower&EnergySystems,2007,29(10):748-758.]提出了一种基于模糊神经网络的在线校准方法运用于工业控制,文献2[LiC,LiuK,WangH.Theincrementallearningalgorithmwithsupportvectormachinebasedonhyperplane-distance[J].AppliedIntelligence,2011,34(1):19-27.]提出了一种支持向量机的在线训练方法,能够实现增量样本的学习。但是文献1、2的方法构建的模型有效时间较短,无法长时间学习,而重新构建支持向量机或神经网络的时间复杂度较高,计算时间较长。文献3[BreimanL.Baggingpredictors[J].Machinelearning,1996,24(2):123-140.]提出了一种集成学习算法——Bagging算法,能够集成多种机器学习算法,组成一个功能更强大的机器学习模型。文献4[PrasadAM,IversonLR,LiawA.Newerclassificationandregressiontreetechniques:baggingandrandomforestsforecologicalprediction[J].Ecosystems,2006,9(2):181-199.]提出了基于Bagging算法的回归树模型,能够对连续型数值进行回归分析,并且具有较低的时间复杂度。但是文献3、4的机器学习方法生成的模型是独立的模型,均不能满足使用需求。
技术实现思路
专利技术目的:针对现有技术中存在的不足,本专利技术的目的是提供一种利用误差传递的空气质量数据实时校准方法,能够有效的提高低精度设备的精度和准确率,能够进行区域部署。技术方案:为实现上述专利技术目的,本专利技术采用的技术方案是:一种利用误差传递的空气质量数据实时校准方法:首先初始化模型,然后采集最近时间段的国标数据和卓易设备数据,并对采集的国标数据进行克里金插值,得到采样频率与卓易设备相等的国标插值数据;其次,对国标插值数据及卓易设备数据进行基于Bagging模型的建模;接着,基于上次模型的误差,对本次Bagging模型输出的结果进行数据校准,得到校准值;最后等待最新国标数据的采集,并根据新采集的国标数据,来更新校准误差,并将误差传递给下一个模型。所述的利用误差传递的空气质量数据实时校准方法,具体过程如下:1)建立模型,通过多次实验的方法初始化模型参数,初始化误差error为0,每次建模使用的训练数据集大小m为30000条,误差影响率alpha为0.9,每次校准的数据量n为8;2)实时采集最近时间段的国标数据和卓易设备数据,并保存至实时数据库,并对采集的国标数据进行克里金插值,得到采样频率与卓易设备相等的国标插值数据;其中,克里金插值采用普通克里金法;3)对国标插值数据及卓易设备数据进行基于Bagging模型的建模;其中,Bagging模型使用基于回归树的Bagging模型,回归树时间复杂度为O(m*logm),其中m为训练集大小;4)使用误差传递的方法,基于上次模型的误差,对本次Bagging模型输出的结果进行数据实时校准,得到校准值;5)等待最新国标数据的采集,并根据新采集的国标数据,来更新校准误差。继续执行步骤2),并将误差传递给下一个模型。步骤2)中,普通克里金法使用空间上已知的点来估计未知的点,如式(1)所示:其中,Y′n+1为估计值,其真实值为Yn+1,且满足估计值与真实值之间的经验均方误差最小和无偏估计两个条件,即满足式(2)和式(3)E(Y′n+1-Yn+1)=0(3)使用拉格朗日方法求得估计值Y′n+1。步骤3)中,Bagging模型:对训练集进行多次随机抽样,生成多个训练子集,并对每个训练子集使用回归树的方法进行建模,最后使用投票的方式,对多个回归树模型进行组合,形成了Bagging校准模型。步骤4)中,数据实时校准方法的基本过程为:(1)从步骤2)的实时数据库读入时间上最近的一个数据集;(2)使用步骤3)的Bagging模型得到得到下个时间段n个数据的校准值;;(3)根据拉依达准则去除n个校准值中的误差值,并对结果取均值average;(4)更新校准值为average+alpha*error,以该结果作为该时间段的测量均值;所述的拉依达准则假设一组测量数据只含有随机误差,对这组数据进行计算得到标准偏差,然后按一定概率确定一个区间,如果数据在该区间之外,则该数据属于粗大误差而不是随机误差,应被剔除;即对一组测量值X1,X2….Xn,其均值为μ,标准偏差为σ;若Xi满足式(4),则认为Xi为误差应被剔除;|Xi-μ|>I*σ(4)式(4)参数I被初始化为3。步骤5)中,等待最新国标数据的采集,并根据新采集的国标数据,来更新校准误差为:国标均值-测量均值。有益效果:与现有技术相比,本专利技术的一种利用误差传递的空气质量数据实时校准的方法,用于校准空气流动速度平缓的环境下的空气参数数据,为每次空气质量数据的校准建立一个Bagging模型,并考虑到空气质量环境的时间序列相关性,在基于回归树的Bagging算法的基础上,通过模型误差将各个模型相关起来,能够实现空气质量数据的实时校准。本方法考虑在空气流动速度平缓状态下,空气质量数据在时间上具有连续性,设备误差也具有连续性,每次使用最近时间段的历史数据作为训练数据,并计算模型误差,使用上一个模型的误差来校准下一个模型的数据。通过对宜兴的实测数据进行模型验证,本方法能够有效的提高低精度设备的精度和准确率,能够进行区域部署,应用于实际生产环境,具有很好的实用性。附图说明图1是方法总体流程示意图;图2是Bagging模型示意图;图3是空气质量数据实时校准流程图。具体实施方式下面结合实施例对本专利技术作进一步说明。实施例1本实施例的样区为江苏省宜兴市。宜兴市北纬31°07′本文档来自技高网
...
一种利用误差传递的空气质量数据实时校准方法

【技术保护点】
一种利用误差传递的空气质量数据实时校准方法,其特征在于:首先初始化模型,然后采集最近时间段的国标数据和卓易设备数据,并对采集的国标数据进行克里金插值,得到采样频率与卓易设备相等的国标插值数据;其次,对国标插值数据及卓易设备数据进行基于Bagging模型的建模;接着,基于上次模型的误差,对本次Bagging模型输出的结果进行数据校准,得到校准值;最后等待最新国标数据的采集,并根据新采集的国标数据,来更新校准误差,并将误差传递给下一个模型。

【技术特征摘要】
1.一种利用误差传递的空气质量数据实时校准方法,其特征在于:首先初始化模型,然后采集最近时间段的国标数据和卓易设备数据,并对采集的国标数据进行克里金插值,得到采样频率与卓易设备相等的国标插值数据;其次,对国标插值数据及卓易设备数据进行基于Bagging模型的建模;接着,基于上次模型的误差,对本次Bagging模型输出的结果进行数据校准,得到校准值;最后等待最新国标数据的采集,并根据新采集的国标数据,来更新校准误差,并将误差传递给下一个模型。2.根据权利要求1所述的利用误差传递的空气质量数据实时校准方法,其特征在于,具体过程如下:1)建立模型,使用多次实验的方法确定模型参数;2)采集最近时间段的国标数据和卓易设备数据,并对采集的国标数据进行克里金插值,得到采样频率与卓易设备相等的国标插值数据;其中,克里金插值采用普通克里金法;3)对国标插值数据及卓易设备数据进行基于Bagging模型的建模;其中,Bagging模型使用基于回归树的Bagging模型,回归树时间复杂度为O(n*logn),其中n为训练集大小;4)基于上次模型的误差,对本次Bagging模型输出的结果进行数据实时校准,得到校准值;5)等待最新国标数据的采集,并根据新采集的国标数据,来更新校准误差,继续执行步骤2),并将误差传递给下一个模型。3.根据权利要求2所述的利用误差传递的空气质量数据实时校准方法,其特征在于,步骤2)中,普通克里金法使用空间上已知的点来估计未知的点,如式(1)所示:其中,Y′n+1为估计值,其真实值为Yn+1,且满足估计值与真实值之间的经验均方误差最小和无偏估计两个条件,即满足...

【专利技术属性】
技术研发人员:戴晶谢乾蒋圣龚俊谢智
申请(专利权)人:江苏卓易信息科技股份有限公司南京百敖软件有限公司昆山百敖电子科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1