当前位置: 首页 > 专利查询>中南大学专利>正文

一种面向公共安全事件信息获取的时空聚类方法技术

技术编号:16346154 阅读:36 留言:0更新日期:2017-10-03 22:24
本发明专利技术公开了一种面向公共安全事件信息获取的时空聚类方法,提取出网络文本中有关公共安全事件的信息并行性聚类处理,然后进行可视化,分析出公共事件的影响范围、发展过程和可能结果等。采用本发明专利技术,能够在公共安全事件发生以后,结合事件类型和事件关键词,快速地从网络社交网站中抽取与该事件有关的有效信息,进而通过时空聚类算法和地图可视化系统,高效地获取事件发展过程和演化规律,有助于公共事件处置决策的确定,提高公共事件的处置效率。

【技术实现步骤摘要】
一种面向公共安全事件信息获取的时空聚类方法
本专利技术属于众源网络数据应用于公共安全事件管理、监控、预警、应急响应领域,特别涉及一种面向公共安全事件信息获取的时空聚类方法。
技术介绍
随着全国经济的高速发展以及全国城镇化的不断推进,越来越多的人口集中到城市中来。城市人口数据量的急剧增长为城市公共管理造成了一定的麻烦。目前,城市各类公共事件的管理主要有政府部门负责,包括有城管部门、警察机关、消防机关、医疗部门、防灾减灾中心、灾难应变指挥中心等(朱武雄,2010;徐志胜等,2005;),这些政府机构为城市公民的生活以及生命财产提供了一道有效的安全屏障。然而,由于城市每天发生公共事件数量庞大,政府相关部门人力物力资源缺少,再加之各部门之间协调存在一定困难,导致部分公共事件得不到有效的处理。近年来,随着互联网和移动便携技术的发展,使越来越多的城市公民能随手分享身边的事情,这为普通大众参与到公共安全事件的管理提供了可能。事实上,根据相关研究学者的调查显示,正处于转型期的中国社会也迫切渴望普通群众能够参与到公共安全事件的管理(王莹等,2015;徐琳,2014;锁利銘,2014;),一方面,公众参与能体现出普通公民在城市日常事物管理中的参与、决策作用,发挥出公民的主体性,另一方面,城市公共管理需要公众的积极参与,以弥补当前信息、资源的不足。总而言之,公众参与既是城市公共管理的发展趋势,又是当前情势下的迫切需要。目前,公众参与到公共安全事件管理的方式主要是通过网络社交媒体发表身边的一些事件信息或者对某些事件的看法,收集这些数据并加以提取分析,可以获取大量事件相关信息,进而应用于公共安全事件的管理,提高事件处理效率,使事件管理走向智慧化(张娅楠,2014;RossC等,2011;)。以新浪微博为例,新浪微博作为中国最大的网络社交平台,日平均活跃用户上亿,已成为公众参与公共安全管理的一个重要平台,每天都有众多的用户通过微博平台上传有关公共安全事件管理的微博数据,例如,2015年5月中旬长沙市连续下降暴雨,在政府相关机构快速发布暴雨预警并开展其他防洪防涝工作的同时,新浪微博平台上已有1840000多条相关数据,其内容中包括救援信息、灾情信息、灾情预警信息等,收集整理这些数据,挖掘出其中有用的信息,将辅助工作人员进行决策,并帮助减灾工作的快速、有效进行;又如,2014年浙江奉化塌楼事件,公众纷纷在互联网上对政府处理结果发表意见,人民网的舆情分析师提取了这些数据并分析,将公众意见数据进行处理,得到公众这对此次公共安全事件处理结果倾向态度,为后续的事件处理提供了参考,避免事件处理不当引起民愤;又如,2014年云南鲁甸发生地震,互联网上不断有公众上传灾区情况,包括救援物资发放情况,重点受灾区域情况等,一些救灾工作人员搜集网上的救灾数据,并整理分析后提取出数据中的救助信息,这些信息不仅帮助受灾人员及时了解救援情况,而且有利于灾区施救人员全面了解灾情情况,推动了救灾的快速进行。然而,根据调查研究显示,目前公众在网络平台中产生的数据主要被应用于公共事件发生后的舆情监控与分析领域,在公共安全事件管理、监控、预警以及应急响应等领域相应的理论和方法较少,并鲜有应用。
技术实现思路
针对当前公共安全事件处置过程中,存在数据获取不及时、信息源较少等问题,本专利技术结合网络众源数据的特点,提出了一种面向公共安全事件信息获取的时空聚类方法,并将其应用于公共安全事件管理中,旨在充分发挥网络众源数据的作用,提高公共安全事件处置效率。为了实现上述技术目的,本专利技术的技术方案是,一种面向公共安全事件信息获取的时空聚类方法,包括以下步骤:步骤1:获取与突发公共安全事件有关的社交媒体数据,并将数据存入数据缓存区A中;步骤2:遍历数据缓存区A中的每条数据,利用基于条件随机场模型的中文切词算法,将每条数据切成若干词汇的集合;再从中抽取数据的时间、位置、事件类型和事件等级属性,并将数据规则化为<时间,位置,事件类型,事件等级>4元组;将规则化数据存入数据缓存区B;步骤3:根据该突发公共安全事件的自身信息,提取该突发公共安全事件的发生时间、发生位置和事件类型以建立公共安全事件的时空聚类的核信息,并以<时间,位置,事件类型>3元组作为时空聚类的核信息;步骤4:遍历缓存区B中的数据,分别计算每条数据到核信息的时间距离、空间距离和文本距离,将3种距离均小于给定阈值的数据,归入候选结果数据集合C;然后根据集合C中的事件等级属性,将数据分成若干簇,完成时空聚类;步骤5:根据聚类结果的时空特征,将其叠加到地图上,展现事件在时间、空间上的发展过程。所述的方法,步骤1中获得与突发公共安全事件有关的社交媒体数据,包括以下步骤:根据该突发的公共安全事件分类,利用社交网站提供的API函数,输入事件关键词、时间范围和事件发生的地点,获取与该事件有关的社交媒体数据。所述的方法,步骤2所述的数据规则化包括以下步骤:(1)遍历缓存区A中的每条数据,利用基于条件随机场模型的切词算法,对该条数据进行分词处理,将每条数据切成若干词汇的集合;(2)遍历每条数据的词汇集合,利用时间抽取算法,确定每条数据的时间属性;(3)遍历每条数据的词汇集合,利用位置抽取算法,确定每条数据的位置属性;(4)遍历每条数据的词汇集合,利用规则归并算法,确定每条数据的事件类型和等级;(5)根据(2)~(4)过程确定的属性信息,将每条数据规则化为<时间,地点,事件类型,事件等级>4元组,即使用该4元组概化每条数据;(6)将规则化的数据条目存入数据缓存区B。所述的一种面向公共安全事件信息获取的时空聚类方法,所述的步骤4包括以下处理步骤:(1)设定聚类的时间距离、空间距离和文本距离3个距离阈值;(2)遍历缓存区B的数据,剔除所有与核信息事件类型不相同的数据;(3)遍历清理后的缓存区B,计算该条数据与核信息的时间距离、空间距离和文本距离,当三种距离均小于给定的对应距离阈值时,该条数据归入事件数据集合C;(4)遍历集合C,依据每条数据元组的事件等级,将集合C划分成不同等级的数据簇,完成时空聚类。所述的一种面向公共安全事件信息获取的时空聚类方法,步骤1中所述的公共安全事件是指突发的自然灾害、重特大事故、环境公害和人为破坏。所述的一种面向公共安全事件信息获取的时空聚类方法,所述的API函数是指网络社交网站发布的用于获取网络社交数据的应用开发接口函数,用于依据关键词、时间范围、地理范围获取实时的网络社交数据。中所述的一种面向公共安全事件信息获取的时空聚类方法,步骤2中所述的中文切词方法是指基于条件随机场模型的中文分词算法,利用条件随机场模型将句子、段落切分成若干词汇的集合后并标注每个词汇的词性,以提取文本中的关键信息。中所述的一种面向公共安全事件信息获取的时空聚类方法,步骤3和4中所述的时空聚类核信息是指数据聚类的基准信息,用于通过计算数据与核信息的距离,确定是否归入聚类结果集;所述的时间距离是指发表数据包含的时间与核信息设定时间的时间差;所述的空间距离是指数据描述的空间位置与核信息设定位置的空间平面距离;所述的文本距离是指文本的内容相似程度,通过主题模型计算得到0~1之间的相似度数值,数值越靠近1,表示文本越本文档来自技高网
...
一种面向公共安全事件信息获取的时空聚类方法

【技术保护点】
一种面向公共安全事件信息获取的时空聚类方法,其特征在于,包括以下步骤:步骤1:获取与突发公共安全事件有关的社交媒体数据,并将数据存入数据缓存区A中;步骤2:遍历数据缓存区A中的每条数据,利用基于条件随机场模型的中文切词算法,将每条数据切成若干词汇的集合;再从中抽取数据的时间、位置、事件类型和事件等级属性,并将数据规则化为<时间,位置,事件类型,事件等级>4元组;将规则化数据存入数据缓存区B;步骤3:根据该突发公共安全事件的自身信息,提取该突发公共安全事件的发生时间、发生位置和事件类型以建立公共安全事件的时空聚类的核信息,并以<时间,位置,事件类型>3元组作为时空聚类的核信息;步骤4:遍历缓存区B中的数据,分别计算每条数据到核信息的时间距离、空间距离和文本距离,将3种距离均小于给定阈值的数据,归入候选结果数据集合C;然后根据集合C中的事件等级属性,将数据分成若干簇,完成时空聚类;步骤5:根据聚类结果的时空特征,将其叠加到地图上,展现事件在时间、空间上的发展过程。

【技术特征摘要】
1.一种面向公共安全事件信息获取的时空聚类方法,其特征在于,包括以下步骤:步骤1:获取与突发公共安全事件有关的社交媒体数据,并将数据存入数据缓存区A中;步骤2:遍历数据缓存区A中的每条数据,利用基于条件随机场模型的中文切词算法,将每条数据切成若干词汇的集合;再从中抽取数据的时间、位置、事件类型和事件等级属性,并将数据规则化为<时间,位置,事件类型,事件等级>4元组;将规则化数据存入数据缓存区B;步骤3:根据该突发公共安全事件的自身信息,提取该突发公共安全事件的发生时间、发生位置和事件类型以建立公共安全事件的时空聚类的核信息,并以<时间,位置,事件类型>3元组作为时空聚类的核信息;步骤4:遍历缓存区B中的数据,分别计算每条数据到核信息的时间距离、空间距离和文本距离,将3种距离均小于给定阈值的数据,归入候选结果数据集合C;然后根据集合C中的事件等级属性,将数据分成若干簇,完成时空聚类;步骤5:根据聚类结果的时空特征,将其叠加到地图上,展现事件在时间、空间上的发展过程。2.根据权利要求1所述的方法,其特征在于,步骤1中获得与突发公共安全事件有关的社交媒体数据,包括以下步骤:根据该突发的公共安全事件分类,利用社交网站提供的API函数,输入事件关键词、时间范围和事件发生的地点,获取与该事件有关的社交媒体数据。3.根据权利要求1所述的方法,其特征在于,步骤2所述的数据规则化包括以下步骤:(1)遍历缓存区A中的每条数据,利用基于条件随机场模型的切词算法,对该条数据进行分词处理,将每条数据切成若干词汇的集合;(2)遍历每条数据的词汇集合,利用时间抽取算法,确定每条数据的时间属性;(3)遍历每条数据的词汇集合,利用位置抽取算法,确定每条数据的位置属性;(4)遍历每条数据的词汇集合,利用规则归并算法,确定每条数据的事件类型和等级;(5)根据(2)~(4)过程确定的属性信息,将每条数据规则化为<时间,地点,事件类型,事件等级>4元组,即使用该4元组概化每条数据;(6)将规则化的数据条目存入数据缓存区B。4.根据权利要求1中所述的一种面向公共安全事件信息获取的时空聚类方法,其特征在于,所述的步骤4包括以下处理步骤:(1)设定聚类的时间距离、空间距离和文本距离3个距离阈值;(2)遍历缓存区B的数据,剔除所有与核信息事件类型不相同...

【专利技术属性】
技术研发人员:李光强尹健刘银萍
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1