当前位置: 首页 > 专利查询>天津大学专利>正文

基于聚类的城市基础设施突发事件的检测方法技术

技术编号:10929204 阅读:173 留言:0更新日期:2015-01-21 10:51
本发明专利技术公开了一种基于聚类的城市基础设施突发事件的检测方法,首先,接收市民反映城市基础设施问题的电话,并记录到工单数据库中;对数据库筛选后,用中文分词技术对所筛选出的工单提取语义关键词,整理语义关键词间的因果关系,然后提取该工单的地址关键词;对工单做语义聚类;对语义层面上的每个聚类做空间聚类;对空间层面上的每个聚类做时间聚类,从而得到时间层面上的聚类,认定时间层面上的聚类是城市基础设施突发事件,用城市基础设施突发事件的根节点的可视设计方案在地图上展示这些城市基础设施突发事件的分布,从而检测出城市基础设施突发事件,让用户做出更快更明智的决策来解决城市基础设施的问题。

【技术实现步骤摘要】

本专利技术涉及一种考虑时间、空间和语义三个维度的聚类算法从城市基础设施诉求问题中检测出突发事件,支持决策。
技术介绍
现在,城市基础设施发展,不管对于一个国家或者是人们都是非常重要的。越来越多的管理者开始关注城市基础设施发展。对此,人们关注最多的莫过于生活中的供水、电、燃气、排水、出行交通等方面,北方的人们还会关注供热的问题。这些行业的发展和管理,和人们的生活状态和城市的发展运营都息息相关。在不同的国家,不同的城市,开始产生了各种城市的管理服务的系统或者机构,比如美国的311系统,英国的101系统,中国的12319系统。像供水、燃气等等这样和市民生活相关的数据也开始变得越来越可用。在这样的背景下,对城市基础设施发展和管理的研究也变得有意义和价值。像供水、燃气这样的行业,如果有一些设施的故障或整修,这样的突发事件会对市民的生活有很大的影响。本专利技术在技术上是和聚类相关的,在应用上是和城市基础设施相关的。一般的单个的科研工作已经有很多国内外科研专家研究,也已经有了大量的研究成果,但是用考虑时间、空间和语义三个维度的聚类方法来研究城市基础设施相关的数据的情况并不多。如今有很多人研究城市基础设施数据,在这些基础设施数据逐渐变得可用的时候,对城市基础设施的研究有很多。有研究人员针对公共服务对未来100年的风险和不确定性做了估计;有的人建立了一种关于基础设施间相互依赖的模型,希望能够发现不同类型基础设施之间的关系,验证可能一类基础设施的问题会导致另一类设施的问题。但大多数的研究者只是从管网数据中研究问题,而本专利技术依据12319电话数据,它是市民针对基础设施问题真实反映的诉求;而管网数据并不能完全地包含市民反映的问题,它只是突发事件发生后的一个整体的情况,它所涉及到的粒度没有一个个的电话诉求那么细,所以当管网数据没有显示基础设施有问题时,并不代表真的就没有问题。聚类算法在各个领域上运用的很广泛,有专家发展了一种迭代的聚类算法,有人则基于语义聚类发展了一种路径查询算法。聚类作为一种数据挖掘手段已经被广泛使用,但是大部分聚类算法只是在时间或空间上处理,也有一些专门的文本聚类算法,少有同时时间、空间和语义的聚类。而本专利技术由于数据和研究的需要,定义两个工单是否相近,就应该考虑齐全它们的属性,即综合时间、空间、语义做聚类。关于城市基础设施的聚类也很多,有人在空间扫描统计方法上扩展成一种可以检测水分布网络爆管点的聚类事件的方法。但真正和本专利技术研究的方向和模型相似的方法并不多,更何况,在很多国家和城市,不存在供热的问题。地理资讯系统(Geographic Information System,简称GIS)相关的研究就更多了,GIS在很多需要地图的项目(例如实时交通网络)和研究中都有被用到。城市是一个有面积的实体,也就是说它是适合地图应用的。另外,在GIS的基础上加入其他技术和应用的例子也不少,有人基于GIS提出了一个整合的基础设施管理系统。也有人结合GIS和城市基础设施做了研究,而本专利技术则在GIS基础上加入要研究的应用。
技术实现思路
城市管理服务热线系统的数据是以市民诉求工单的形式存在,然而突发事件的信息对城市管理者来说更有价值。本专利技术旨在对电话诉求数据进行清洗和处理后,在时间、空间和语义内容三个尺度上对工单做综合的聚类,进而找出相似的反映同一个突发事件的工单。当城市管理者知道有这样一些工单实际上是一个突发事件的反映,他们就能更快的根据总结出来的在某个地区某个时间段发生的突发事件做出处理的决策,而不是根据一条条表面上看不出联系的工单。本专利技术是从处理对象——工单出发,从图1也可以看出来这个基于聚类的城市基础设施突发事件检测方法的最终目的是,检测出城市基础设施突发事件,从而可以做出更快更明智的决策来解决城市基础设施的问题。在经过语义和地址关键词的处理和语义、空间、时间聚类后,对得到的突发事件做可视分析设计,通过根节点的方案可以更深入地看到突发事件在地图上的分布情况、更直观地在突发事件中发现严重的突发事件,如图5;所以突发事件的可视分析设计让用户在突发事件发生后很快地得知突发事件的具体原因、相应后果和发生的位置,帮助其决策。为了解决上述技术问题,本专利技术一种基于聚类的城市基础设施突发事件的检测方法包括以下步骤:步骤一、利用城市管理服务热线系统接收市民反映城市基础设施问题的电话,然后,将该电话内容记录到一工单数据库中,所述工单数据库至少包括以下内容:工单编号、接收工单的时间、工单反映的问题所涉及到的城市基础设施的类别、描述该电话所反映的城市基础设施问题的文本和该电话所反映的城市基础设施问题的地址;其中,所述工单反映的问题所涉及到的城市基础设施的类别包括供热、自来水、燃气、排水和供热,城市基础设施问题的地址是层级的;步骤二、根据接收工单的时间和工单反映的问题所涉及到的城市基础设施的类别对工单数据库进行筛选;使用中文分词技术对所筛选出的工单提取工单描述的电话所反映的城市基础设施问题的文本中的语义关键词,所述语义关键词是城市基础设施问题的原因或结果的词语;整理对应的语义关键词间的因果关系,用于定义城市基础设施突发事件在语义内容这一维度上的种类;使用中文分词技术对所筛选出的工单提取工单所反映的城市基础设施问题的地址中的地址关键词,从而提取出工单所反映的城市基础设施问题的地址的每个层级的地址单元;步骤三、对步骤二处理后的工单进行语义聚类:根据工单的语义关键词的提取统计信息和整理的语义关键词间的因果关系把工单归到匹配的城市基础设施突发事件语义种类中,从而得到在语义层面上的聚类,包括:如果工单反映的城市基础设施问题的文本中包括步骤二确定的某种反映城市基础设施突发事件的原因的语义关键词,则将该工单归到这种城市基础设施突发事件中;如果工单反映的城市基础设施问题的文本中同时出现了多个反映不同类别的城市基础设施突发事件的原因的语义关键词,则将该工单归到这些城市基础设施突发事件中含有反映城市基础设施突发事件的结果的语义关键词最多的城市基础设施突发事件中;如果工单反映的城市基础设施问题的文本中只出现了反映城市基础设施突发事件的结果的语义关键词X,则在该工单的接收时间的前后2天内找在语义上出现了和上述结果的语义关键词有因果关系的原因的语义关键词的工单,如果找到的符合条件的工单已经归到相应的城市基础设施突发事件中,则把该工单也归到这种城市基础设施突发事件中;如果没有找到符合条件的工单,则把该工单归到包含结果的语义关键词X的城市基础设本文档来自技高网
...
基于聚类的城市基础设施突发事件的检测方法

【技术保护点】
一种基于聚类的城市基础设施突发事件的检测方法,其特征在于:步骤一、利用城市管理服务热线系统接收市民反映城市基础设施问题的电话,然后,将该电话内容记录到一工单数据库中,所述工单数据库至少包括以下内容:工单编号、接收工单的时间、工单反映的问题所涉及到的城市基础设施的类别、描述该电话所反映的城市基础设施问题的文本和该电话所反映的城市基础设施问题的地址;其中,所述工单反映的问题所涉及到的城市基础设施的类别包括供热、自来水、燃气、排水和供热,城市基础设施问题的地址是层级的;步骤二、根据接收工单的时间和工单反映的问题所涉及到的城市基础设施的类别对工单数据库进行筛选;使用中文分词技术对所筛选出的工单提取工单描述的电话所反映的城市基础设施问题的文本中的语义关键词,所述语义关键词是城市基础设施问题的原因或结果的词语;整理对应的语义关键词间的因果关系,用于定义城市基础设施突发事件在语义内容这一维度上的种类;使用中文分词技术对所筛选出的工单提取工单所反映的城市基础设施问题的地址中的地址关键词,从而提取出工单所反映的城市基础设施问题的地址的每个层级的地址单元;步骤三、对步骤二处理后的工单进行语义聚类:根据工单的语义关键词的提取统计信息和整理的语义关键词间的因果关系把工单归到匹配的城市基础设施突发事件语义种类中,从而得到在语义层面上的聚类,包括:如果工单反映的城市基础设施问题的文本中包括步骤二确定的某种反映城市基础设施突发事件的原因的语义关键词,则将该工单归到这种城市基础设施突发事件中;如果工单反映的城市基础设施问题的文本中同时出现了多个反映不同类别的城市基础设施突发事件的原因的语义关键词,则将该工单归到这些城市基础设施突发事件中含有反映城市基础设施突发事件的结果的语义关键词最多的城市基础设施突发事件中;如果工单反映的城市基础设施问题的文本中只出现了反映城市基础设施突发事件的结果的语义关键词X,则在该工单的接收时间的前后2天内找在语义上出现了和上述结果的语义关键词有因果关系的原因的语义关键词的工单,如果找到的符合条件的工单已经归到相应的城市基础设施突发事件中,则把该工单也归到这种城市基础设施突发事件中;如果没有找到符合条件的工单,则把该工单归到包含结果的语义关键词X的城市基础设施突发事件,且该城市基础设施突发事件是所有包含结果的语义关键词X的城市基础设施突发事件中优先级最高的城市基础设施突发事件;城市基础设施突发事件的优先级是规定城市基础设施突发事件发生后需要做出反应并解决的紧急程度;如果工单反映的城市基础设施问题的文本中没有任何反映城市基础设施突发事件的原因或结果的语义关键词,则该条工单在语义上不属于任何城市基础设施突发事件;步骤四、对步骤三中得到的语义层面上的每个聚类进行空间聚类,从而得到在空间层面上的聚类:遍历每个聚类中的工单,判断聚类中有相同的地址关键词的工单的个数是否大于等于3,当聚类中有相同的地址关键词的工单的个数大于等于3时,则初步认定这些工单的集合成为一个城市基础设施突发事件;当聚类中有相同的地址关键词的工单的个数小于3时,定义一个最大经纬度距离D,遍历该聚类中的所有工单,如果两条工单的经纬度距离d大于0而小于等于D,则把它们归为一个空间层面上的聚类;遍历后,要求空间层面上的聚类包含的工单的个数大于等于3;否则,舍弃这样的空间层面上的聚类;步骤五、对步骤四中得到的空间层面上的每个聚类进行时间聚类,从而得到在时间层面上的聚类:设定时间聚类中最大的时间尺度为5天,空间层面上的每个聚类中的工单可能在同一天或者相邻的天数内被接收,统计空间层面上的每个聚类中的所有工单的被接收的时间,得到所有的日期、每个日期对应的出现的次数和接收时间是该日期的所有工单的集合;按照日期出现的次数从大到小对日期排序后得到日期的集合F,遍历日期的集合F的每个日期Y,如果日期的集合F中,存在与日期Y相差前后2天内的日期Z,则将空间层面上的聚类中接收时间在日期Y和Z的工单聚在一起,并从日期的集合F将日期Y和日期Z删除;如果日期的集合F中,不存在与日期Y相差前后2天内的日期,则遍历日期的集合F中的下一个日期;遍历后,得到在时间层面上的聚类,要求它们包含的工单的个数大于等于3;否则,舍弃这样的时间层面上的聚类;步骤六、认定步骤五中得到的时间层面上的聚类是城市基础设施突发事件,用城市基础设施突发事件的根节点的可视设计方案在地图上展示这些城市基础设施突发事件的分布,从而检测出城市基础设施突发事件;所述的城市基础设施突发事件的根节点,是指城市基础设施突发事件中的第一个所反映的城市基础设施问题的文本包含反映城市基础设施突发事件原因或结果的语义关键词的工单。...

【技术特征摘要】
1.一种基于聚类的城市基础设施突发事件的检测方法,其特征在于:
步骤一、利用城市管理服务热线系统接收市民反映城市基础设施问题的电话,然后,
将该电话内容记录到一工单数据库中,所述工单数据库至少包括以下内容:
工单编号、接收工单的时间、工单反映的问题所涉及到的城市基础设施的类别、描述
该电话所反映的城市基础设施问题的文本和该电话所反映的城市基础设施问题的地址;其
中,所述工单反映的问题所涉及到的城市基础设施的类别包括供热、自来水、燃气、排水
和供热,城市基础设施问题的地址是层级的;
步骤二、根据接收工单的时间和工单反映的问题所涉及到的城市基础设施的类别对工
单数据库进行筛选;
使用中文分词技术对所筛选出的工单提取工单描述的电话所反映的城市基础设施问题
的文本中的语义关键词,所述语义关键词是城市基础设施问题的原因或结果的词语;整理
对应的语义关键词间的因果关系,用于定义城市基础设施突发事件在语义内容这一维度上
的种类;
使用中文分词技术对所筛选出的工单提取工单所反映的城市基础设施问题的地址中的
地址关键词,从而提取出工单所反映的城市基础设施问题的地址的每个层级的地址单元;
步骤三、对步骤二处理后的工单进行语义聚类:
根据工单的语义关键词的提取统计信息和整理的语义关键词间的因果关系把工单归到
匹配的城市基础设施突发事件语义种类中,从而得到在语义层面上的聚类,包括:
如果工单反映的城市基础设施问题的文本中包括步骤二确定的某种反映城市基础设施
突发事件的原因的语义关键词,则将该工单归到这种城市基础设施突发事件中;
如果工单反映的城市基础设施问题的文本中同时出现了多个反映不同类别的城市基础
设施突发事件的原因的语义关键词,则将该工单归到这些城市基础设施突发事件中含有反
映城市基础设施突发事件的结果的语义关键词最多的城市基础设施突发事件中;
如果工单反映的城市基础设施问题的文本中只出现了反映城市基础设施突发事件的结
果的语义关键词X,则在该工单的接收时间的前后2天内找在语义上出现了和上述结果的
语义关键词有因果关系的原因的语义关键词的工单,
如果找到的符合条件的工单已经归到相应的城市基础设施突发事件中,则把该工单
也归到这种城市基础设施突发事件中;
如果没有找到符合条件的工单,则把该工单归到包含结果的语义关键词X的城市
基础设施突发事件,且该城市基础设施突发事件是所有包含结果的语义关键词X...

【专利技术属性】
技术研发人员:张加万许冰晗鄂艳丽赵雅慧孙丽婷马婧
申请(专利权)人:天津大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1