使用多个数据源的空气质量推断制造技术

技术编号：14504659 阅读：44 留言：0更新日期：2017-01-31 13:02

对来自多个数据源的数据的使用提供针对多个区域的与特定污染物有关的推断的空气质量指数，而无需将空气质量监测站添加到那些区域。可从一个或多个空气质量监测站获得针对某地区中的污染物的标记的空气质量指数数据。可从针对该地区的空间上相关的数据中提取针对该地区的空间特征。空间上相关的数据可包括关于该地区中的固定基础设施的信息。同样，可从针对该地区的随时间改变的时间上相关的数据中提取针对该地区的时间特征。基于协同训练的学习框架还可至少基于标记的空气质量指数数据、针对该地区的空间特征以及针对该地区的时间特征来被应用以协同训练空间分类器和时间分类器。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】背景关于城市空气质量的信息(诸如SO2和NO2的浓度)在保护人类健康和控制空气污染方面起作用。空气质量在各城市空间中可有很大地不同，因为空气质量受多种因素影响，诸如气象状态、汽车流量和模式以及不同区域中的土地使用。例如，工业和商业区往往比居民区生成更多的空气污染。由此，监测城市环境中的空气质量可能需要大量分布在城市环境各处的空气质量监测站。然而，设置足够数目的空气质量监测站存在许多障碍。一个障碍是构建这些站的成本以及永久地安置和维护这些空气质量监测站的成本。另一个障碍是城市环境中有限的土地可用于构造这样的空气质量监测站。例如，获得用于构造空气质量监测站的土地可能由于对该土地的现有使用而过于昂贵或可不行。附加的障碍可能是与空气质量监测站的操作相关联的环境成本量。尽管单个空气质量监测站的能耗可能很小，但操作空气质量监测站网络可消耗相对较大量的能量，并由此可能正好对使空气质量降级的污染有贡献。概述本文中描述了用于基于来自现有空气质量监测站的历史和实时空气质量数据以及来自其他数据源的空间和时间数据来推断针对某地区中的各区域的空气质量信息的技术。其他数据源可提供气象数据、交通流量数据、人类移动数据、道路结构数据、和/或兴趣点数据等等。这些技术可基于训练两个分开的分类器(诸如，空间分类器和时间分类器)的协同训练框架来使用半监督学习方法。空间分类器可将空间上相关的特征(例如，兴趣点的密度、道路长度等)取为输入以对不...
<a href="http://www.xjishu.com/zhuanli/55/CN105493109.html" title="使用多个数据源的空气质量推断原文来自X技术">使用多个数据源的空气质量推断</a>

【技术保护点】
一个或多个存储计算机可执行指令的计算机可读介质，所述计算机可执行指令在被执行时使得一个或多个处理器执行以下动作，包括：从一个或多个空气质量监测站获得针对地区中的污染物的标记的空气质量指数数据；从针对所述地区的空间上相关的数据中提取针对所述地区的空间特征，所述空间上相关的数据包括与所述区域中的固定基础设施相关联的信息；从针对所述区域的时间上相关的数据中提取针对所述区域的时间特征，所述时间上相关的数据包括针对所述区域的随时间改变的数据；以及应用基于协同训练的学习框架来至少基于所述标记的空气质量指数数据、针对所述地区的空间特征以及针对所述地区的时间特征来协同训练空间分类器和时间分类器。

【技术特征摘要】
【国外来华专利技术】1.一个或多个存储计算机可执行指令的计算机可读介质，所述计算机可执
行指令在被执行时使得一个或多个处理器执行以下动作，包括：
从一个或多个空气质量监测站获得针对地区中的污染物的标记的空气质
量指数数据；
从针对所述地区的空间上相关的数据中提取针对所述地区的空间特征，所
述空间上相关的数据包括与所述区域中的固定基础设施相关联的信息；
从针对所述区域的时间上相关的数据中提取针对所述区域的时间特征，所
述时间上相关的数据包括针对所述区域的随时间改变的数据；以及
应用基于协同训练的学习框架来至少基于所述标记的空气质量指数数据、
针对所述地区的空间特征以及针对所述地区的时间特征来协同训练空间分类
器和时间分类器。
2.如权利要求1所述的一个或多个计算机可读介质，其特征在于，所述动
作进一步包括：
基于为所述地区中的区域观察到的空间上相关的数据来获得针对所述区
域的空间特征；
基于为所述地区中的所述区域观察到的时间上相关的数据来获得针对所
述区域的时间特征；
使用所述空间分类器至少基于所述空间特征来生成针对所述区域中的所
述污染物的空间概率分数；
使用所述时间分类器至少基于所述时间特征来生成针对所述区域中的所
述污染物的时间概率分数；以及
至少基于所述空间概率分数和所述时间概率分数来计算与所述区域中的
所述污染物有关的空气质量指数水平。
3.如权利要求2所述的一个或多个计算机可读介质，其特征在于，所述计
算包括至少基于所述空间概率分数和所述时间概率分数的乘积来计算所述空
气质量指数水平。
4.如权利要求2所述的一个或多个计算机可读介质，其特征在于，为所述

\t区域观察到的空间上相关的数据包括道路网络数据或兴趣点数据中的至少一
者，并且其中为所述区域观察到的时间上相关的数据包括车流量数据、人类移
动数据或气象数据中的至少一者。
5.如权利要求2所述的一个或多个计算机可读介质，其特征在于，所述区
域缺少提供针对所述污染物的空气质量指数水平的空气质量监测站。
6.如权利要求1所述的一个或多个计算机可读介质，其特征在于，所述应
用包括应用所述基于协同训练的学习框架来对所述空间分类器和所述时间分
类器进行协同训练以用于为所述地区中的区域推断所述污染物的空气质量指
数水平。
7.如权利要求1所述的一个或多个计算机可读介质，其特征在于，所述应
用所述基于协同训练的学习框架包括：
用针对所述地区的空间特征来训练所述空间分类器；
用针对所述地区的时间特征来训练所述时间分类器；以及
应用所述空间分类器和所述时间分类器来通过以下方式迭代地推断未标
记的区域：对于每一后续训练迭代轮次，将一个或多个最确信地分类的示例添
加到所述地区中的标记的区域中，直到所述地区中剩下的未标记的区域均被标
记或者预定数目的迭代轮次已被执行。
8.如权利要求1所述的一个或多个计算机可读介质，其特征在于，为所述
地区观察到的空间上相关的数据包括道路网络数据或兴趣点数据中的至少一
者，并且其中为所述地区观察到的时间上相关的数据包括车流量数据、人类移
动数据或气象数据中的至少一者。
9.如权利要求1所述的一个或多个计算机可读介质，其特征在于，所述空
间分类器是人工神经网络(ANN)分类器，并且其中所述时间分类器是线性链
条件随机场(CRF)分类器、隐马尔可夫模型(HMM)分类器或最大熵马尔可
夫模型分类器之一。
10.一种计算机实现的方法，包括：
应用基于协同训练的学习框架来至少基于来自地区中的一个或多个空气
质量监测站的标记的空气质量指数数据、与所述地区相关联的空间特征的集
合、以及与所述地区相关联的时间特征的集合来协同训练空间分类器和时间分

\t类器；
基于为所述地区中的区域观察到的空间上相关的数据来获得针对所述区
域的空间特征的附加集合；
基于为所述地区中的所述区域观察到的时间上相关的数据来获得针对所
述区域的时间特征的附加集合；
使用所述空间分类器至少基于针对所述区域的空间特征的附加集合来生
成针对所述区域中的污染物的空间概率分数；使用所述时间分类器至少基于针
对所述区域的时间特征的附加集合来生成针对所述区域中的所述污染物的时
间概率分数；以及
至少基于所述空间概率分数和所述时间概率分数来计算与所述区域中的
所述污染物有关的空气质量指数水平。
11.如权利要求10所述的计算机实现的方法，其特征在于，进一步包括：
从一个或多个空气质量监测站获得针对所述地区中的所述污染物的所述
标记的空气质量指数数据；
从针对所述地区的空间上相关的数据提取与所述地区相关联的空间特征，
所述空间上相关的数据包括与所述地区中的所述固定基础设施相关联...

【专利技术属性】
技术研发人员：Y·郑，X·谢，WY·马，HW·洪，E·IC·常，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人