社会化网络媒体数据中城市空气污染事件的识别方法技术

技术编号:21061310 阅读:17 留言:0更新日期:2019-05-08 07:36
本发明专利技术公开了一种社会化网络媒体数据中城市空气污染事件的识别方法,首先以社会化网络媒体数据为数据源,从其中的历史数据中提取与城市空气污染相关的数据,其中,城市空气污染相关数据的获取从用户的直接环境空气描述和污染事件描述两方面获取,并以环境污染事件类型、栅格化城区位置、社会化媒体属性为重构指引,重构成具有完整语义功能的多模态城市空气污染基本事件数据;然后从社会化网络媒体数据中提取城市空气污染事件识别指标集;最后依据城市空气污染重要监测指标体系对社会化网络媒体数据中的城市空气污染事件进行识别。本发明专利技术解决了现有城市空气污染事件监测技术匮乏的问题。

【技术实现步骤摘要】
社会化网络媒体数据中城市空气污染事件的识别方法
本专利技术属于社会化网络媒体数据分析
,具体涉及一种社会化网络媒体数据中城市空气污染事件的识别方法。
技术介绍
空气质量是指人类、植物、动物和建筑物等暴露于其中的空气的好坏。人类活动或自然过程使得某些化学物质、颗粒物、生物质及其它有害物进入大气中,造成空气污染,导致空气质量的恶化。近年来各国的研究证实,空气质量对人类的身心健康具有显著影响,空气中污染物的浓度与人类呼吸系统疾病、心脏病等多种疾病的发病率、死亡率存在显著的正相关,与心理疾病的发病也存在潜在关联。为了解决城市空气污染问题、提升环境质量,需要开展城市空气质量评价与影响分析、空气污染预测与源治理等工作,而这些工作的重要基础之一是城市空气污染事件的快速、高效识别。面对这一现实需求,可以社会化媒体数据作为城市空气环境监测的补充数据来源,设计基于社会化网络媒体数据的城市空气污染事件识别方法,作为现有城市空气污染事件监测技术的有效补充。
技术实现思路
本专利技术的目的是提供一种社会化网络媒体数据中城市空气污染事件的识别方法,解决了现有城市空气污染事件监测技术匮乏的问题。本专利技术所采用的技术方案是,社会化网络媒体数据中城市空气污染事件的识别方法,具体按照以下步骤实施:步骤1、以社会化网络媒体数据为数据源,从其中的历史数据中提取与城市空气污染相关的数据,其中,城市空气污染相关数据的获取从用户的直接环境空气描述和污染事件描述两方面获取,并以环境污染事件类型、栅格化城区位置、社会化媒体属性为重构指引,重构成具有完整语义功能的多模态城市空气污染基本事件数据;步骤2,从社会化网络媒体数据中提取城市空气污染事件识别指标集;步骤3、依据城市空气污染重要监测指标体系对社会化网络媒体数据中的城市空气污染事件进行识别。本专利技术的特点还在于,步骤2具体按照以下步骤实施:步骤2.1、在直接描述城市空气质量的指标方面,提取网民描述环境空气质量的典型语义模式,包括描述对象和描述特征词;步骤2.2、在城市空气污染事件方面,提取归纳潜在的污染源类型、污染事件名称、污染事件动态描述、相关污染因子要素、人体感受;步骤2.3、基于步骤2.1及步骤2.2,结合相应的区域位置的历史环境空气信息,建立城市空气污染重要监测指标体系。步骤2.1中网民描述环境空气质量的典型语义模式分别从工业生产、城市交通、居民生活多方面提取,同时提取出相应的地理区域、描述对象、以及空气质量特征词。步骤2.2中污染源类型包括:工业、农业、居民生活、交通运输业、建筑业;污染事件名称包括化学品、尾气、秸秆、垃圾、烟囱、工地、涂料、油漆;污染事件动态描述包括排放、泄露、爆炸、燃烧、焚烧;相关污染因子要素包括废气、黑烟、硫黄、氨氮;人体感受包括呛、熏、刺鼻、臭、难闻。步骤2.3中区域位置以人口密度、土地特征因素为依据对城市区域进行栅格化处理;历史环境空气信息是建立城市空气污染重要监测指标体系,涉及多个方面的评价检测指标,如细颗粒物PM2.5、可吸入颗粒物PM10。步骤3具体按照以下步骤实施:步骤3.1、基于证据理论完成并实现城市空气污染事件的不确定性融合,并采用优化求解的方式近似计算证据函数;步骤3.2、对社会化网络媒体数据中的城市污染现象依据证据函数进行深入语义理解与融合,并映射至城市环境空气重要监测指标体系,得到整合后的更为抽象的决策层集语义形式,进而完成对城市污染事件的识别。步骤3.1中以原证据函数m_origin与近似后证据函数m间的证据距离以及近似计算前后证据函数的不确定度变化的加权和作为目标函数,约束条件为证据焦元势以及焦元个数的限制,即其中,obj(m)为所需最小化的目标函数,α,β为加权系数,m_origin为原证据函数m为近似后证据函数,dJ(m_origin,m)代表原证据函数m_origin与近似后证据函数m间的证据距离,U(·)代表证据不确定度,A,B代表焦元,m(·)为基本概率分配函数,k1代表焦元的最大势,k2代表焦元的最大个数,Θ代表识别框架。步骤3.2中在进行城市空气污染事件的不确定性融合之前,在传统的框架转换基础上引入中间粒度层框架进行框架的一致性转换,即与寻找各个既有框架Θi(i=1,KL)之间距离最小的中间框架Θopt,而后,基于中间框架针对所有既有框架进行相应地粗化或细化操作,再进行证据融合。本专利技术的有益效果是,社会化网络媒体数据中城市空气污染事件的识别方法,基于社会化网络媒体数据中用户实时发布的相关数据进行城市空气污染事件的识别,从而使得本方法所获得的事件识别结果准确并具有高时效性;在进行城市空气污染事件的理解与识别过程中,使用到的相应的监测指标体系以及在不确定性融合过程中使用到的证据函数都可预先离线完成,不基于实时用户数据,从而使得本方法在运算时间上大幅减少。附图说明图1是本专利技术社会化网络媒体数据中城市空气污染事件的识别方法流程图。具体实施方式下面结合附图和具体实施方式对本专利技术进行详细说明。本专利技术社会化网络媒体数据中城市空气污染事件的识别方法,如图1所示,具体按照以下步骤实施:步骤1、以社会化网络媒体数据为数据源,从其中的历史数据中提取与城市空气污染相关的数据,其中,城市空气污染相关数据的获取从用户的直接环境空气描述和污染事件描述两方面获取,并以环境污染事件类型、栅格化城区位置、社会化媒体属性为重构指引,重构成具有完整语义功能的多模态城市空气污染基本事件数据;步骤2,从社会化网络媒体数据中提取城市空气污染事件识别指标集,具体按照以下步骤实施:步骤2.1、在直接描述城市空气质量的指标方面,提取网民描述环境空气质量的典型语义模式,包括描述对象和描述特征词;步骤2.2、在城市空气污染事件方面,提取归纳潜在的污染源类型、污染事件名称、污染事件动态描述、相关污染因子要素、人体感受;步骤2.3、基于步骤2.1及步骤2.2,结合相应的区域位置的历史环境空气信息,建立城市空气污染重要监测指标体系。其中,步骤2.1中网民描述环境空气质量的典型语义模式分别从工业生产、城市交通、居民生活多方面提取,同时提取出相应的地理区域、描述对象、以及空气质量特征词。步骤2.2中污染源类型包括:工业、农业、居民生活、交通运输业、建筑业;污染事件名称包括化学品、尾气、秸秆、垃圾、烟囱、工地、涂料、油漆;污染事件动态描述包括排放、泄露、爆炸、燃烧、焚烧;相关污染因子要素包括废气、黑烟、硫黄、氨氮;人体感受包括呛、熏、刺鼻、臭、难闻。步骤2.3中区域位置以人口密度、土地特征因素为依据对城市区域进行栅格化处理;历史环境空气信息是建立城市空气污染重要监测指标体系,涉及多个方面的评价检测指标,如细颗粒物PM2.5、可吸入颗粒物PM10;步骤3、依据城市空气污染重要监测指标体系对社会化网络媒体数据中的城市空气污染事件进行识别,具体按照以下步骤实施:步骤3.1、基于证据理论完成并实现城市空气污染事件的不确定性融合,并采用优化求解的方式近似计算证据函数;步骤3.2、对社会化网络媒体数据中的城市污染现象依据证据函数进行深入语义理解与融合,并映射至城市环境空气重要监测指标体系,得到整合后的更为抽象的决策层集语义形式,进而完成对城市污染事件的识别。步骤3.1中以原证据函数m_origin与近似本文档来自技高网...

【技术保护点】
1.社会化网络媒体数据中城市空气污染事件的识别方法,其特征在于,具体按照以下步骤实施:步骤1、以社会化网络媒体数据为数据源,从其中的历史数据中提取与城市空气污染相关的数据,其中,城市空气污染相关数据的获取从用户的直接环境空气描述和污染事件描述两方面获取,并以环境污染事件类型、栅格化城区位置、社会化媒体属性为重构指引,重构成具有完整语义功能的多模态城市空气污染基本事件数据;步骤2,从社会化网络媒体数据中提取城市空气污染事件识别指标集;步骤3、依据城市空气污染重要监测指标体系对社会化网络媒体数据中的城市空气污染事件进行识别。

【技术特征摘要】
1.社会化网络媒体数据中城市空气污染事件的识别方法,其特征在于,具体按照以下步骤实施:步骤1、以社会化网络媒体数据为数据源,从其中的历史数据中提取与城市空气污染相关的数据,其中,城市空气污染相关数据的获取从用户的直接环境空气描述和污染事件描述两方面获取,并以环境污染事件类型、栅格化城区位置、社会化媒体属性为重构指引,重构成具有完整语义功能的多模态城市空气污染基本事件数据;步骤2,从社会化网络媒体数据中提取城市空气污染事件识别指标集;步骤3、依据城市空气污染重要监测指标体系对社会化网络媒体数据中的城市空气污染事件进行识别。2.根据权利要求1所述的社会化网络媒体数据中城市空气污染事件的识别方法,其特征在于,所述步骤2具体按照以下步骤实施:步骤2.1、在直接描述城市空气质量的指标方面,提取网民描述环境空气质量的典型语义模式,包括描述对象和描述特征词;步骤2.2、在城市空气污染事件方面,提取归纳潜在的污染源类型、污染事件名称、污染事件动态描述、相关污染因子要素、人体感受;步骤2.3、基于步骤2.1及步骤2.2,结合相应的区域位置的历史环境空气信息,建立城市空气污染重要监测指标体系。3.根据权利要求2所述的社会化网络媒体数据中城市空气污染事件的识别方法,其特征在于,所述步骤2.1中网民描述环境空气质量的典型语义模式分别从工业生产、城市交通、居民生活多方面提取,同时提取出相应的地理区域、描述对象、以及空气质量特征词。4.根据权利要求2所述的社会化网络媒体数据中城市空气污染事件的识别方法,其特征在于,所述步骤2.2中污染源类型包括:工业、农业、居民生活、交通运输业、建筑业;污染事件名称包括化学品、尾气、秸秆、垃圾、烟囱、工地、涂料、油漆;污染事件动态描述包括排放、泄露、爆炸、燃烧、焚烧;相关污染因子要素包括废气、黑烟、硫黄、氨氮;人体感受包括呛、熏、刺鼻、臭、难闻。5.根据权利要求2所述的社会化网络...

【专利技术属性】
技术研发人员:雷蕾周亚东王煦焜付冉
申请(专利权)人:西安理工大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1