一种基于多领域特征的城市空气质量等级预测方法技术

技术编号:10743579 阅读:154 留言:0更新日期:2014-12-10 16:27
本发明专利技术涉及一种基于多领域特征的城市空气质量等级预测方法,包括数据预处理阶段、训练阶段、预测阶段;数据预处理阶段进行网格划分得到训练样本,获取训练数据集;训练阶段估计出条件随机场模型最优参数,得到最优模型并输出条件随机场模型;预测阶段采用维特比算法结合训练阶段学习得到的条件概率模型求得条件概率P(Y/Xf)最大的输出序列并输出预测结果。本发明专利技术方法可以更准确地预测AQI等级,并对各站点接下来一定时间段内的AQI等级进行预测,满足人们挑选空气质量较好的时间段进行外出活动的需要。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及,包括数据预处理阶段、训练阶段、预测阶段;数据预处理阶段进行网格划分得到训练样本,获取训练数据集;训练阶段估计出条件随机场模型最优参数,得到最优模型并输出条件随机场模型;预测阶段采用维特比算法结合训练阶段学习得到的条件概率模型求得条件概率P(Y/Xf)最大的输出序列并输出预测结果。本专利技术方法可以更准确地预测AQI等级,并对各站点接下来一定时间段内的AQI等级进行预测,满足人们挑选空气质量较好的时间段进行外出活动的需要。【专利说明】
本专利技术涉及一种城市AQI等级预测方法,尤其涉及一种基于多领域特征的空气质量监测站点AQI等级预测方法。
技术介绍
空气是地球上的生物赖以生存的物质,是必不可少的一种物质。环境空气质量与人们的日常生活息息相关,同时也在城市环境综合评价中占有重要地位。但是随着人类文明和经济的发展,空气污染越来越严重,如何改善空气质量、合理进行大气环境质量预测预警变得越来越重要,根据空气质量预测,人们可以采取相应措施如带口罩,尽量避免外出等,保护自己免受空气污染物的侵害。 传统的空气质量预测方法一般仅考虑把原始数据作为预测模型的特征,而原始数据并不能充分体现数据的统计学特性,如集中趋势和离散趋势,这必然严重影响预测结果的准确性。一些产生式模型,如马尔科夫模型很好地利用了大气压,温度,交通等特征,但由于产生式模型的标记偏置和独立性假设等固有缺陷,导致预测准确率依旧不太理想;判别式模型,如决策树、支持向量机等,的学习和计算过程比较复杂。而条件随机场既具有判别式模型的优点,又具有产生式模型的优点,其考虑了上下文标记间的转移概率,以序列化形式进行全局参数优化和解码。另一方面,传统的空气质量预测通常是对接下来一整天的空气质量进行预测,这种粗粒度时间段的空气质量预测存在一个弊端,假设明天的空气质量预测结果是优,表明对空气污染物较敏感的人群可以进行户外活动,而实际上某些时间段(如上午8:00-9:00,下午5:00-6:00)的空气质量有可能是中度污染或者重度污染,对空气污染较敏感人群在这些时间段不宜进行户外活动。因此,对接下来一天的空气质量进行细粒度时间段的预测更为合理,为此设计是非常有必要的。
技术实现思路
本专利技术为克服上述的不足之处,本专利技术提出了,该方法可以更准确地预测AQI等级,满足人们挑选空气质量较好的时间段进行外出活动的需要。 本专利技术是通过以下技术方案达到上述目的:,包括数据预处理阶段、训练阶段、预测阶段; 数据预处理阶段: I)对影响空气质量的多个领域的数据进行采集; 2)把城市划分成不相交的网格,每个网格g内的空气污染物浓度相同; 3)网格g所在的城市有m个含有空气监测站点的网格,抽取这些网格对应的每小时的空间特征和时间特征,每个小时可以生成m个训练样本;若历史数据跨越η个小时,则可以得到nXm个训练样本; 训练阶段: I)训练数据集的获得及特征函数的定义:过去k个时刻生成的k个向量构成训练特征向量集Xt = {Xp X2,...,XkI,其与过去k个时刻的AQI等级构成的标记序列Y= (Y1,Y2,...,YJ组成训练数据集;特征函数包括状态特征函数和转移特征函数; 2)基于定义的特征函数,采用拟牛顿法的BFGS算法对训练数据集进行学习,估计出条件随机场模型最优参数,得到最优模型Pa頌并输出条件随机场模型; 预测阶段: I)预测特征向量集的获得:要预测的每个时刻i生成一个特征向量Xi, η个时刻生成 η 个向量 Xf = (X1, X2, , Xj ; 2)利用预测特征向量集Xf = (X1, X2, , XJ作为输入序列,采用维特比算法结合训练阶段学习得到的条件概率模型Pov刀求得条件概率p(Y/xf)最大的输出序列/= {7:, r2,K}并输出预测结果。 作为优选,所述的空间特征包括:交通相关特征Fi ;时间特征包括:气象学相关特征Fm、空气污染物相关特征K。 作为优选,所述的训练特征向量集或预测特征向量集中的向量包括交通相关特征F,、气象学相关特征K、空气污染物相关特征尺三类特征。 作为优选,所述的状态特征函数包括生成的状态特征函数集 ,P, f'*', 了'*2,...,...,其中包括6Xp个函数,一般形式如下式所示: N Λ,如果Y,=r,特征=ν? 人.? = {0,其他 其中i表示多领域特征向量的第i行(I < i < k)) ,Yi表示第i行对应的时刻的AQI等级。 作为优选,所述的转移特征函数包括生成的转移特征函数集 /—),其中包括6 X 6 X p个函数,一般形式如下式所示: t _ Λ 如果γ,+—, =ri,}^2,特征=ν, *r*r^ — Ιο,其他 其中i表示特征向量集的第i行(I彡i彡k)),Yi表示第i行对应的时刻的AQI等级,Yi^1表示第i_l行对应的时刻的AQI等级。 本专利技术的有益效果在于:(I)引入气象学,交通和空气污染物等领域相关特征,全面地模拟真实世界中影响空气质量的潜在系统,从而可以更准确地预测AQI等级;(2)基于条件随机场模型和多领域特征向量对细粒度时间段(小时)的AQI等级进行预测,满足人们挑选空气质量较好的时间段进行外出活动的需要;(3)采用条件随机场模型,克服了传统产生式模型标记偏置和条件独立性假设的缺陷;在学习过程,采用拟牛顿法的BFGS算法,保证了全局收敛性和超线性收敛速度。 【专利附图】【附图说明】 图1是基于多领域特征的空气质量等级预测方法流程图; 图2是预处理阶段流程图; 图3是网格及其影响区域; 图4是气象学相关特征窗口不意图; 图5是空气污染物相关特征窗口示意图; 图6是训练阶段流程图; 图7是预测阶段流程图。 【具体实施方式】 下面结合具体实施例对本专利技术进行进一步描述,但本专利技术的保护范围并不仅限于此: 实施例:本专利技术提出了基于多领域特征的AQI等级预测方法,流程如图1所示。该方法分为数据预处理、训练和预测三个阶段。其中,预处理阶段数据流用点划线表示,训练阶段数据流用虚线表示,预测阶段数据流用实线表示。 数据预处理阶段的流程如图2所示,其主要步骤包括: I)针对某个城市,对影响空气质量的多个领域,如气象学,交通,空气污染物等的历史、实时数据和未来一定时间段的气象学预报数据进行采集; 2)把城市a划分成不相交的网格,每个网格g = g.wxg.h具有相同的长g.w和宽g.h,用g.。表示网格g的中心点。用ga(w,h)表示将a划分成不相交的长为w宽为h的网格集合 【权利要求】1.,其特征在于,包括数据预处理阶段、训练阶段、预测阶段; 数据预处理阶段: 1)对影响空气质量的多个领域的数据进行采集; 2)把城市划分成不相交的网格,每个网格g内的空气污染物浓度相同; 3)网格g所在的城市有m个含有空气监测站点的网格,抽取这些网格对应的每小时的空间特征和时间特征,每个小时可以生成m个训练样本;若历史数据跨越η个小时,则可以得到nXm个训练样本; 训练阶段: 1)训练数据集的获得及特征函数的定义:过去k个时刻生成的k个向量构成训练特征向量集Xt= (X1本文档来自技高网
...

【技术保护点】
一种基于多领域特征的城市空气质量等级预测方法,其特征在于,包括数据预处理阶段、训练阶段、预测阶段;数据预处理阶段:1)对影响空气质量的多个领域的数据进行采集;2)把城市划分成不相交的网格,每个网格g内的空气污染物浓度相同;3)网格g所在的城市有m个含有空气监测站点的网格,抽取这些网格对应的每小时的空间特征和时间特征,每个小时可以生成m个训练样本;若历史数据跨越n个小时,则可以得到n×m个训练样本;训练阶段:1)训练数据集的获得及特征函数的定义:过去k个时刻生成的k个向量构成训练特征向量集Xt={X1,X2,...,Xk},其与过去k个时刻的AQI等级构成的标记序列Y={Y1,Y2,...,Yk}组成训练数据集;特征函数包括状态特征函数和转移特征函数;2)基于定义的特征函数,采用拟牛顿法的BFGS算法对训练数据集进行学习,估计出条件随机场模型最优参数,得到最优模型并输出条件随机场模型;预测阶段:1)预测特征向量集的获得:要预测的每个时刻i生成一个特征向量Xi,n个时刻生成n个向量Xf={X1,X2,...,Xn};2)利用预测特征向量集Xf={X1,X2,...,Xn}作为输入序列,采用维特比算法结合训练阶段学习得到的条件概率模型求得条件概率P(Y/Xf)最大的输出序列并输出预测结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:王敬昌陈岭赵江奇袁翠丽鲁东丽李纺
申请(专利权)人:浙江鸿程计算机系统有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1