当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于在线顺序回归的空气质量等级预测方法技术

技术编号:17878787 阅读:40 留言:0更新日期:2018-05-06 00:38
本发明专利技术公开了一种基于在线顺序回归的空气质量等级预测方法,包括:步骤1、输入空气监测历史数据;步骤2、对所述的空气质量样本数据进行预处理;步骤3:训练在线顺序回归空气质量等级预测模型;步骤4:输入待预测空气质量样本数据;步骤5:对所述待预测空气质量样本数据进行预处理;步骤6:通过在线顺序回归模型预测空气质量等级。本发明专利技术适用环境检测技术领域,能够高效、准确的从空气质量历史数据训练出预测模型进行空气质量等级预测,有效改善空气质量、合理的进行空气环境质量预测、预警。

A prediction method of air quality grade based on online ordinal regression

The invention discloses an air quality grade prediction method based on online sequential regression, including step 1, input air monitoring historical data, step 2, preprocessing the air quality sample data, step 3: training online sequential regression air quality pretest model; step 4: input air to predict air. Quality sample data; step 5: preprocess the air quality sample data to be predicted; step 6: predict air quality by an online sequential regression model. The invention is applicable to the field of environmental detection technology, and can effectively and accurately train the prediction model from the air quality historical data to predict the air quality grade, improve the air quality effectively, and reasonably predict and warn the air environment quality.

【技术实现步骤摘要】
一种基于在线顺序回归的空气质量等级预测方法
本专利技术涉及环境预测
,尤其涉及一种基于在线顺序回归的空气质量等级预测方法。
技术介绍
空气是人类赖以生存的不可或缺的物质,环境空气质量和人们的日常生活息息相关,同时也在居民居住环境综合评价占有重要地位,但随着工业化和城镇化的推进以及私人车辆的持续增加,空气质量持续恶化,大气污染日益严重,雾霾天气严重影响了人们的工作和生活。如何改善空气质量、合理的进行空气环境质量预测预警变得越来越重要。传统的基于分类的空气质量预测方法在实际实现中需要将所有训练数据调入内存处理,庞大的数据量和有限的应用环境成为传统分类学习方法的主要制约因素。时至今日,历史空气质量数据的数据量已经积累庞大到不可忽视的地步,传统的基于分类的空气质量预测方法已经不能满足庞大的历史空气质量数据的处理需求。同时传统的基于分类的空气质量预测方法对于空气质量仅仅回答了‘好’或者‘不好’,不能满足进一步对空气质量分类的需求;其次,空气质量等级数据在时间和空间上分布不平衡,如何有效识别其中较少的空气质量等级数据显得极为重要,传统的基于分类的方法没有考虑到该分布不平衡问题,其性能具有较大的局限性。
技术实现思路
本专利技术为克服现有技术的不足之处,提出一种基于在线顺序回归的空气质量预测方法,以期能高效、准确的从空气质量历史数据训练出预测模型进行空气质量等级预测,有效改善空气质量、合理的进行空气环境质量预测、预警。为了达到上述目的,本专利技术采用的技术方案为:本专利技术一种基于在线顺序回归的空气质量等级预测方法的特点是按如下步骤进行:步骤一:在线顺序回归的空气质量等级预测模型训练步骤1.1:采集历史T天空气质量监测数据作为T个空气质量样本,并提取第t个空气质量样本中d个空气质量指标作为所述第t个空气质量样本的质量指标,记为表示第t个空气质量样本中第i个空气质量指标,t=1,2,…,T;令所述第t个空气质量样本的等级记为yt,且yt∈{1,2,…,h},yt=1时,表示最高等级,当yt=h时,表示最低等级;步骤1.2:对所述第t个空气质量样本的质量指标xt进行标准化处理,得到第t个空气质量样本的特征向量并与所述第t个空气质量样本的等级yt构成第t个样本空间(x′t,yt),从而得到T个空气质量样本的样本空间,记为步骤1.3:定义当前迭代次数为n,最大迭代次数为N;并初始化n=1;步骤1.4:输入空气质量训练样本(x′n,yn);x′n为第n次迭代时输入的第n个空气质量样本的特征向量;yn表示第n次迭代时输入的第n个空气质量样本的等级;利用式(1)更新第n次迭代时等级为yn的空气质量样本的一阶统计信息式(1)中,当n=1时,为d维零向量;利用式(2)更新第n次迭代时等级为yn的空气质量样本的二阶统计信息式(2)中,当n=1时,为d×d维零向量;(x′n)T表示x′n的转置;步骤1.5:判断yn=1是否成立,若成立,则执行步骤1.6;否则,判断yn=h是否成立,若成立,则执行步骤1.10,否则执行步骤1.8;步骤1.6:利用式(3)定义空气质量等级预测模型第n次迭代的经验损失函数L(wn):式(1)中,λ为常量;wn为空气质量等级预测模型权值向量,为wn的转置,当n=1时,wn为d维零向量;表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本xi的等级为2;表示第n次迭代时空气质量等级为2的空气质量样本统计个数;步骤1.7:利用式(4)更新第n次迭代的梯度gn后,执行步骤1.12:式(4)中,表示第n次迭代时等级为2的空气质量样本的一阶统计信息;表示第n次迭代时等级为2的空气质量样本的二阶统计信息;步骤1.8:利用式(5)定义空气质量等级预测模型第n次迭代的损失函数L(wn):式(5)中,表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本xi的等级为yn-1;表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本xi的等级为yn+1;分别表示第n次迭代时空气质量等级为yn-1,yn+1的空气质量样本的统计个数;步骤1.9:利用式(6)更新第n次迭代的梯度gn后,执行步骤1.12:式(6)中,分别表示第n次迭代时等级为yn-1,yn+1的空气质量样本的一阶统计信息;分别表示第n次迭代时等级为yn-1,yn+1的空气质量样本的二阶统计信息;步骤1.10:利用式(7)定义空气质量等级预测模型第n次迭代的损失函数L(wn):式(7)中,表示指定的空气质量样本等级yi=h-1;表示第n次迭代时空气质量等级为h-1的空气质量样本统计个数。步骤1.11:利用式(8)更新第n次迭代的梯度gn:式(8)中,表示第n次迭代时等级为h-1的空气质量样本的一阶统计信息;表示第n次迭代时等级为h的空气质量样本的二阶统计信息;步骤1.12:利用式(9)得到第n次迭代时梯度一阶动量无偏估计式(9)中,为常量β1的n次方,mn为第n次迭代时有偏梯度一阶动量估计,并由式(10)中获得:mn=β1mn-1+(1-β1)·gn(10)式(10)中,当n=1时,mn-1为d维零向量;步骤1.13:利用式(11)得到梯度二阶动量无偏估计式(11)中,为常量β2的n次方,vn为第n次迭代时有偏梯度二阶动量估计,并由式(12)中获得:式(12)中,当n=1时,vn-1为d维零向量;步骤1.13:利用式(13)更新第n次迭代的权值向量wn+1:式(13)中,α,γ为常量;步骤1.14、令n+1赋值给n,并判断n>N是否成立,若成立,则表示获得最优预测模型wN+1,并执行步骤二,否则,返回步骤1.4执行;步骤二:空气质量等级预测:步骤2.1:获取待预测的空气质量数据的d个空气质量指标并进行标准化处理后得到待测样本x,步骤2.2:利用式(14)得到所述待测样本x的决策函数值f(x):f(x)=x(wN)T(14)步骤2.3:根据等级集合{1,2,…,h},得到所述决策函数值f(x)所属的等级即为所述待测样本x的空气质量等级。与已有技术相比,本专利技术的有益效果体现在:1、本专利技术不同于传统基于分类的空气质量等级预测方法,提出一种基于在线顺序回归的空气质量等级预测方法,通过d个空气质量预测指标,利用收敛更快速的方法在线处理分布不平衡的空气质量数据,训练空气质量等级预测模型,实现了高效、准确的空气质量等级预测。2、本专利技术在训练样本数据过程中,采用在线训练的方式,每次训练只采用样本集中的一个空气质量样本数据,通过保存空气质量样本数据特征向量的一阶统计信息和二阶统计信息来计算单个样本梯度信息,有效避免了传统学习面临的数据量和应用环境限制的问题。3、本专利技术在训练在线顺序回归空气质量等级预测模型过程中,采取直接优化AUC(AreaUnderCurve)指标来定义损失函数,能够很好的度量不平衡数据处理的整体性能,从而克服了传统分类算法不能有效解决空气质量等级数据在时间和空间上分布不平衡的问题,使训练出的分类模型优于传统分类模型,从而提高了异常空气质量等级预测性能和准确率。4、本专利技术基于在线顺序回归进行空气质量等级预测,将目标问题分解为更细致的多等级排序问题。本专利技术将空气质量等级预测为优、良、轻度污染、中度污染、重度污染和严重污染6个等级,进一步满足对空气质量分类的需求。本文档来自技高网...
一种基于在线顺序回归的空气质量等级预测方法

【技术保护点】
一种基于在线顺序回归的空气质量等级预测方法,其特征是按如下步骤进行:步骤一:在线顺序回归的空气质量等级预测模型训练步骤1.1:采集历史T天空气质量监测数据作为T个空气质量样本,并提取第t个空气质量样本中d个空气质量指标作为所述第t个空气质量样本的质量指标,记为

【技术特征摘要】
1.一种基于在线顺序回归的空气质量等级预测方法,其特征是按如下步骤进行:步骤一:在线顺序回归的空气质量等级预测模型训练步骤1.1:采集历史T天空气质量监测数据作为T个空气质量样本,并提取第t个空气质量样本中d个空气质量指标作为所述第t个空气质量样本的质量指标,记为表示第t个空气质量样本中第i个空气质量指标,t=1,2,…,T;令所述第t个空气质量样本的等级记为yt,且yt∈{1,2,…,h},yt=1时,表示最高等级,当yt=h时,表示最低等级;步骤1.2:对所述第t个空气质量样本的质量指标xt进行标准化处理,得到第t个空气质量样本的特征向量并与所述第t个空气质量样本的等级yt构成第t个样本空间(x′t,yt),从而得到T个空气质量样本的样本空间,记为步骤1.3:定义当前迭代次数为n,最大迭代次数为N;并初始化n=1;步骤1.4:输入空气质量训练样本(x′n,yn);x′n为第n次迭代时输入的第n个空气质量样本的特征向量;yn表示第n次迭代时输入的第n个空气质量样本的等级;利用式(1)更新第n次迭代时等级为yn的空气质量样本的一阶统计信息式(1)中,当n=1时,为d维零向量;利用式(2)更新第n次迭代时等级为yn的空气质量样本的二阶统计信息式(2)中,当n=1时,为d×d维零向量;(x′n)T表示x′n的转置;步骤1.5:判断yn=1是否成立,若成立,则执行步骤1.6;否则,判断yn=h是否成立,若成立,则执行步骤1.10,否则执行步骤1.8;步骤1.6:利用式(3)定义空气质量等级预测模型第n次迭代的经验损失函数L(wn):式(1)中,λ为常量;wn为空气质量等级预测模型权值向量,为wn的转置,当n=1时,wn为d维零向量;表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本xi的等级为2;表示第n次迭代时空气质量等级为2的空气质量样本统计个数;步骤1.7:利用式(4)更新第n次迭代的梯度gn后,执行步骤1.12:式(4)中,表示第n次迭代时等级为2的空气质量样本的一阶统计信息;表示第n次迭代时等级为2的空气质量样本的二阶统计信息;步骤1.8:利用式(5)定义空气质量等级预测模型第n次迭代的损失函数L(wn):式(5)中,表示第n次迭代时前n-1个空气质量样本中第i个空气质量样本xi的等级为yn-1;表示第n次迭代时前n-1个空气质量样本中第i个空气质量...

【专利技术属性】
技术研发人员:程凡章霞张闯
申请(专利权)人:安徽大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1