一种基于社交网络大数据的空气质量预警和监测分析系统技术方案

技术编号：13585260 阅读：48 留言：0更新日期：2016-08-24 15:31

本发明专利技术公开了一种空气质量预警和监测分析系统，对社交网络中的文本信息进行收集和分词，与空气质量词库进行对比分类计算，再进行信息的情绪判断，计算情感系数；通过文本的地理位置信息选定该位置范围内的空气监测站的数据作为真值，对比该位置范围内的文本信息的情感系数，建立两者之间的映射关系，达到分析和预警整个城市的空气质量的目的。本发明专利技术中公开的空气质量预警和监测分析系统采用了带有地理信息的社交网络数据，大大地降低了监测成本，并且监测覆盖面广，反应迅速，预测精确度高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种空气质量预警和监测分析系统。
技术介绍
空气质量信息(如PM2.5的浓度)对控制污染和保护人们身体健康有着重要的意义，在一个城市里，通常通过有限的空气质量监测站的监测数据对空气质量进行预警和监测分析，然而，空气质量在城市空间的非线性变化取决于多种因素，如气象、交通量和土地使用等。现有的空气质量监测分析方法包括线性法、高斯插值法、经典的扩散模型，著名分类模型如决策树和线性随机条件场(CRF)，神经网络，数据来源都是空气监测站的数据。以上监测分析系统通常只基于监测站的数据，而监测站由于其建设成本和维修成本高(约200000美元的建设费和每年30000美元的维护费)，并且需要占用了不少的土地和人力资源(如北京只有22个站，占了50*50千米)，使其覆盖率受到了限制，无法覆盖到城市的每个区域，并且城市空气质量的空间变化是非线性的，受多种因素影响；因此，传统的仅依赖于监测站数据的监测分析系统无法精确地反应城市各个区域的空气质量。
技术实现思路
本专利技术的目的在于克服现有技术中存在的缺陷，提供一种基于社交网络大数据的空气质量预警和监测分析系统，这种分析系统能够弥补现有的空气质量监测分析和预警方法中存在的数据覆盖面的缺陷，为空气质量监测分析系统提供更多的数据源以提供更细颗粒度的监测数据分析。为实现上述目的，本专利技术的设计方案如下：一种基于社交网络数据的空气质量预警和监测分析系统，包括以下步骤：1、收集社交网络中监控目标在一段时间内的文本信息I，并将所收集的文本信息I按时间标记，数据形式为(I，时间戳)。2、对所得的文本信息I进行预处理，具体为：利用中...

【技术保护点】
一种基于社交网络数据的空气质量预警和监测分析系统，其特征在于，包括以下步骤：1)收集社交网络中监控目标在一段时间内的文本信息I，并将所述的文本信息I按时间标记，数据形式为(I，时间戳)；2)利用中文分词系统对所述的文本信息I进行分词，获得长度大于等于2的名词、动词和名动词序列，以及识别情感词、程度词和否定词；3)判断所述的文本信息I是否带有地理信息，所述的地理信息包括社交网站提供的地理信息戳和步骤2)中的分词结果，对带有地理信息的所述文本信息I进行下一步处理；4)基于空气质量词库的分类计算，对所述的文本信息I构建信息聚类模型，确定与空气质量相关的文本信息I；5)采用NTUSD法对所述相关的文本信息I进行情绪因素判断，计算情感系数eV值；6)建立向量空间模型来表示每个所述相关的文本信息，表示为RI：(I，地理位置，时间戳，情感系数eV)7)定义地理区块：将一个城市分割成若干区块，每个所述的区块都有一个地理坐标g.loc、一个AQI标签g.Q和所述相关的文本信息集合{g.RIi}，并且将每个所述的区块关联一个已有的空气监测站的位置，将所述的空气检测站的数据作为所述的区块的空气质量真值。8)...

【技术特征摘要】
1.一种基于社交网络数据的空气质量预警和监测分析系统，其特征在于，包括以下步骤：1)收集社交网络中监控目标在一段时间内的文本信息I，并将所述的文本信息I按时间标记，数据形式为(I，时间戳)；2)利用中文分词系统对所述的文本信息I进行分词，获得长度大于等于2的名词、动词和名动词序列，以及识别情感词、程度词和否定词；3)判断所述的文本信息I是否带有地理信息，所述的地理信息包括社交网站提供的地理信息戳和步骤2)中的分词结果，对带有地理信息的所述文...

【专利技术属性】
技术研发人员：刘富强，
申请(专利权)人：苏州爱诺信信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人