使用多个数据源的空气质量推断制造技术

技术编号:14504659 阅读:44 留言:0更新日期:2017-01-31 13:02
对来自多个数据源的数据的使用提供针对多个区域的与特定污染物有关的推断的空气质量指数,而无需将空气质量监测站添加到那些区域。可从一个或多个空气质量监测站获得针对某地区中的污染物的标记的空气质量指数数据。可从针对该地区的空间上相关的数据中提取针对该地区的空间特征。空间上相关的数据可包括关于该地区中的固定基础设施的信息。同样,可从针对该地区的随时间改变的时间上相关的数据中提取针对该地区的时间特征。基于协同训练的学习框架还可至少基于标记的空气质量指数数据、针对该地区的空间特征以及针对该地区的时间特征来被应用以协同训练空间分类器和时间分类器。

【技术实现步骤摘要】
【国外来华专利技术】背景关于城市空气质量的信息(诸如SO2和NO2的浓度)在保护人类健康和控制空气污染方面起作用。空气质量在各城市空间中可有很大地不同,因为空气质量受多种因素影响,诸如气象状态、汽车流量和模式以及不同区域中的土地使用。例如,工业和商业区往往比居民区生成更多的空气污染。由此,监测城市环境中的空气质量可能需要大量分布在城市环境各处的空气质量监测站。然而,设置足够数目的空气质量监测站存在许多障碍。一个障碍是构建这些站的成本以及永久地安置和维护这些空气质量监测站的成本。另一个障碍是城市环境中有限的土地可用于构造这样的空气质量监测站。例如,获得用于构造空气质量监测站的土地可能由于对该土地的现有使用而过于昂贵或可不行。附加的障碍可能是与空气质量监测站的操作相关联的环境成本量。尽管单个空气质量监测站的能耗可能很小,但操作空气质量监测站网络可消耗相对较大量的能量,并由此可能正好对使空气质量降级的污染有贡献。概述本文中描述了用于基于来自现有空气质量监测站的历史和实时空气质量数据以及来自其他数据源的空间和时间数据来推断针对某地区中的各区域的空气质量信息的技术。其他数据源可提供气象数据、交通流量数据、人类移动数据、道路结构数据、和/或兴趣点数据等等。这些技术可基于训练两个分开的分类器(诸如,空间分类器和时间分类器)的协同训练框架来使用半监督学习方法。空间分类器可将空间上相关的特征(例如,兴趣点的密度、道路长度等)取为输入以对不同区域处的空气质量之间的空间相关性进行分类。时间分类器可使用时间上相关的特征(诸如交通流量数据和气象数据)来发现不同区域处的空气质量的时间依赖性。协同训练框架可生成推断模型(即分类器),其被用于基于从小量区域的测得的空气质量数据的有限集合来对附加区域的空气质量进行插值。这些模型可被用来基于来自现有空气质量监测站的实时空气质量数据和其他形式的收集的空间或时间数据来推断附加区域的空气质量。在至少一个实施例中,可从一个或多个空气质量监测站获得针对某地区中的某污染物的标记的空气质量指数数据。可从针对该地区的空间上相关的数据中提取针对该地区的空间特征。空间上相关的数据可包括关于该地区中的固定基础设施的信息。同样,可从针对该地区的随时间改变的时间上相关的数据中提取针对该地区的时间特征。基于协同训练的学习框架可至少基于标记的空气质量指数数据、针对该地区的空间特征以及针对该地区的时间特征来被应用以协同训练空间分类器和时间分类器。因此,这些技术可为多个区域提供空气质量数据(诸如针对特定污染物的空气质量指数),而无需在那些区域安装附加的空气质量监测站。这种对构建空气质量站的必要性的减少或消除可提供货币和能量节省。此外,这些技术可被用来确定将来要建立空气质量监测站的区域,诸如在这些技术预测比预期空气质量差的区域中将要建立空气质量监测站。提供本
技术实现思路
是为了以简化的形式介绍将在以下具体实施例中进一步描述的一些概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。附图简述参考附图来描述具体实施方式。在附图中,附图标记最左边的数字标识该附图标记首次出现的附图。在不同的附图中使用相同的附图标记来指示相似或相同的项。图1是示出用于使用空间和时间分类器来基于多个数据源推断某地区中的多个区域的空气质量指数的示例方案的框图。图2是示出支持基于多个数据源来推断某地区中的多个区域的空气质量指数的计算设备的示例组件的说明性示图。图3是示出用于实现基于多个数据源来推断某地区中的多个区域的空气质量指数的操作原理的示意图。图4是示出有助于标识出某地区中用于空气质量监测站安装的各区域的偏差的3维网格空间的示意图。图5是示出用于训练时间分类器和空间分类器的示例过程的流程图,该时间分类器和空间分类器被用来基于多个数据源来推断某地区中某污染物的质量指数。图6是示出用于使用时间分类器和空间分类器来基于多个数据源推断某区域中某污染物的空气质量指数的示例过程的流程图。图7是示出用于使用所获得的各污染物的空气质量指数水平和各污染物的线性插值水平之间的偏差来确定用于空气质量监测站安装的可能区域的示例过程的流程图。详细描述本文中描述了用于基于来自现有空气质量监测站的历史和实时空气质量数据以及来自其他数据源的空间和时间数据来推断针对某地区中的各区域的空气质量信息技术。其他数据源可包括气象数据、交通流量数据、人类移动数据、道路结构数据、和/或兴趣点数据等等。这些技术可基于训练两个分开的分类器(诸如,空间分类器和时间分类器)的协同训练框架来使用半监督学习方法。空间分类器可将空间上相关的特征(例如,兴趣点的密度、道路长度等)取为输入以对不同区域处的空气质量之间的空间相关性进行分类。在一些实施例中,空间分类器可基于人工神经网络。时间分类器可使用时间上相关的特征(诸如交通流量数据和气象数据)来发现不同区域处的空气质量的时间依赖性。在一些实施例中,时间分类器可以是线性链条件随机场(CRF)。协同训练框架可生成推断模型,该推断模型用于基于从小量区域的测得的空气质量数据的有限集合来对附加区域的空气质量进行插值。这些模型可被用来基于来自现有空气质量监测站的实时空气质量数据和其他形式的收集的空间或时间数据来推断附加区域的空气质量。以下参考图1-7描述了根据各实施例的用于在没有控制质量监测站的情况下推断各区域的实时空气质量信息的技术的示例。示例方案图1是示出用于使用空间和时间分类器来基于多个数据源推断某地区中的多个区域的空气质量指数(AQI)的示例方案100的框图。为其推断AQI的多个区域可缺少空气质量监测站。此外,可推断针对特定区域中存在的多种污染物中的每一者的相应AQI。例如,可推断针对区域中的污染物SO2的第一AQI,同时可推断针对相同区域中的污染物NO2的第二AQI。示例方案100可由计算设备102实现。计算设备102可以是通用计算机,诸如台式计算机、平板计算机、膝上型计算机、一个或多个服务器等。示例方案100可包括特征提取阶段104、分类器协同训练阶段106和推断阶段108。在特征提取阶段104期间,空间特征110可从未标记的源数据112的空间上相关的数据中提取,并且时间特征114可从未标记的源数据112的时间上相关的数据中提取。在各实施例中,空间上相关的数据可包括道路网络数据、兴趣点(POI)数据和/或关于本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN105493109.html" title="使用多个数据源的空气质量推断原文来自X技术">使用多个数据源的空气质量推断</a>

【技术保护点】
一个或多个存储计算机可执行指令的计算机可读介质,所述计算机可执行指令在被执行时使得一个或多个处理器执行以下动作,包括:从一个或多个空气质量监测站获得针对地区中的污染物的标记的空气质量指数数据;从针对所述地区的空间上相关的数据中提取针对所述地区的空间特征,所述空间上相关的数据包括与所述区域中的固定基础设施相关联的信息;从针对所述区域的时间上相关的数据中提取针对所述区域的时间特征,所述时间上相关的数据包括针对所述区域的随时间改变的数据;以及应用基于协同训练的学习框架来至少基于所述标记的空气质量指数数据、针对所述地区的空间特征以及针对所述地区的时间特征来协同训练空间分类器和时间分类器。

【技术特征摘要】
【国外来华专利技术】1.一个或多个存储计算机可执行指令的计算机可读介质,所述计算机可执
行指令在被执行时使得一个或多个处理器执行以下动作,包括:
从一个或多个空气质量监测站获得针对地区中的污染物的标记的空气质
量指数数据;
从针对所述地区的空间上相关的数据中提取针对所述地区的空间特征,所
述空间上相关的数据包括与所述区域中的固定基础设施相关联的信息;
从针对所述区域的时间上相关的数据中提取针对所述区域的时间特征,所
述时间上相关的数据包括针对所述区域的随时间改变的数据;以及
应用基于协同训练的学习框架来至少基于所述标记的空气质量指数数据、
针对所述地区的空间特征以及针对所述地区的时间特征来协同训练空间分类
器和时间分类器。
2.如权利要求1所述的一个或多个计算机可读介质,其特征在于,所述动
作进一步包括:
基于为所述地区中的区域观察到的空间上相关的数据来获得针对所述区
域的空间特征;
基于为所述地区中的所述区域观察到的时间上相关的数据来获得针对所
述区域的时间特征;
使用所述空间分类器至少基于所述空间特征来生成针对所述区域中的所
述污染物的空间概率分数;
使用所述时间分类器至少基于所述时间特征来生成针对所述区域中的所
述污染物的时间概率分数;以及
至少基于所述空间概率分数和所述时间概率分数来计算与所述区域中的
所述污染物有关的空气质量指数水平。
3.如权利要求2所述的一个或多个计算机可读介质,其特征在于,所述计
算包括至少基于所述空间概率分数和所述时间概率分数的乘积来计算所述空
气质量指数水平。
4.如权利要求2所述的一个或多个计算机可读介质,其特征在于,为所述

\t区域观察到的空间上相关的数据包括道路网络数据或兴趣点数据中的至少一
者,并且其中为所述区域观察到的时间上相关的数据包括车流量数据、人类移
动数据或气象数据中的至少一者。
5.如权利要求2所述的一个或多个计算机可读介质,其特征在于,所述区
域缺少提供针对所述污染物的空气质量指数水平的空气质量监测站。
6.如权利要求1所述的一个或多个计算机可读介质,其特征在于,所述应
用包括应用所述基于协同训练的学习框架来对所述空间分类器和所述时间分
类器进行协同训练以用于为所述地区中的区域推断所述污染物的空气质量指
数水平。
7.如权利要求1所述的一个或多个计算机可读介质,其特征在于,所述应
用所述基于协同训练的学习框架包括:
用针对所述地区的空间特征来训练所述空间分类器;
用针对所述地区的时间特征来训练所述时间分类器;以及
应用所述空间分类器和所述时间分类器来通过以下方式迭代地推断未标
记的区域:对于每一后续训练迭代轮次,将一个或多个最确信地分类的示例添
加到所述地区中的标记的区域中,直到所述地区中剩下的未标记的区域均被标
记或者预定数目的迭代轮次已被执行。
8.如权利要求1所述的一个或多个计算机可读介质,其特征在于,为所述
地区观察到的空间上相关的数据包括道路网络数据或兴趣点数据中的至少一
者,并且其中为所述地区观察到的时间上相关的数据包括车流量数据、人类移
动数据或气象数据中的至少一者。
9.如权利要求1所述的一个或多个计算机可读介质,其特征在于,所述空
间分类器是人工神经网络(ANN)分类器,并且其中所述时间分类器是线性链
条件随机场(CRF)分类器、隐马尔可夫模型(HMM)分类器或最大熵马尔可
夫模型分类器之一。
10.一种计算机实现的方法,包括:
应用基于协同训练的学习框架来至少基于来自地区中的一个或多个空气
质量监测站的标记的空气质量指数数据、与所述地区相关联的空间特征的集
合、以及与所述地区相关联的时间特征的集合来协同训练空间分类器和时间分

\t类器;
基于为所述地区中的区域观察到的空间上相关的数据来获得针对所述区
域的空间特征的附加集合;
基于为所述地区中的所述区域观察到的时间上相关的数据来获得针对所
述区域的时间特征的附加集合;
使用所述空间分类器至少基于针对所述区域的空间特征的附加集合来生
成针对所述区域中的污染物的空间概率分数;使用所述时间分类器至少基于针
对所述区域的时间特征的附加集合来生成针对所述区域中的所述污染物的时
间概率分数;以及
至少基于所述空间概率分数和所述时间概率分数来计算与所述区域中的
所述污染物有关的空气质量指数水平。
11.如权利要求10所述的计算机实现的方法,其特征在于,进一步包括:
从一个或多个空气质量监测站获得针对所述地区中的所述污染物的所述
标记的空气质量指数数据;
从针对所述地区的空间上相关的数据提取与所述地区相关联的空间特征,
所述空间上相关的数据包括与所述地区中的所述固定基础设施相关联...

【专利技术属性】
技术研发人员:Y·郑X·谢WY·马HW·洪E·IC·常
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1