当前位置: 首页 > 专利查询>天津大学专利>正文

一种城市问题的可视化分析方法技术

技术编号:20726272 阅读:38 留言:0更新日期:2019-03-30 17:59
本发明专利技术涉及一种城市问题的可视化分析方法,包括:处理原始数据;利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;计算事件集相似度;可视化事件发生的频繁程度;可视化相似事件地点分布。

【技术实现步骤摘要】
一种城市问题的可视化分析方法
本专利技术涉及数据挖掘与可视化
,涉及一种可视化分析方法。
技术介绍
数据挖掘技术以及可视化的发展,给智慧城市的建设带来了新的方式。城市服务中心每天都会收到大量的居民反映的有关城市问题的数据,这给计算机学家研究城市问题提供了很好的研究素材。计算机学家通过数据挖掘算法将城市数据信息进行关联性挖掘,通过可视化方式有效的展现数据之间的规律,以帮助决策者分析城市问题,制定解决方案。
技术实现思路
本专利技术提出一种对城市问题准本溯源和预测的方法,并可视化某个城市问题发生的相似地点帮助决策者分析问题,整体制定决策。技术方案如下:一种城市问题的可视化分析方法,包括下列步骤:1)处理原始数据对原始的市民对城市问题反映的数据进行预处理,将城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,在一天发生某一城市问题发生地点相应属性的位置置为1,否则置为0;通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。2)关联分析事件利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;3)计算事件集相似度某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大;其中γ代表相似度,向量代表事件a的各属性值的向量,向量代表事件b的各属性的向量公式34)可视化事件发生的频繁程度对某一事件按月份、地点统计其发生数目,并利用热力图的方式展示,以时间为坐标轴,可通过调整坐标轴动态展示该事件发生的地点、时间以及发生数目多少;通过有向图的方式列举出与该事件有关联的事件,并按关联度从大到小的排序进行展示,有向图中与原事件之间的连线宽度代表事件之间关联度的大小,关联度越高,连线的宽度值越大;有向图中的原点代表事件的代表事件出现的次数,出现次数越多,原点的值越大;5)可视化相似事件地点分布在某一特定时间下,确定某一特定坐标,计算改坐标发生的事件集合与其他不同坐标位置发生的事件集合的相似度,并按照相似大小进行排序,在地图上列举出与该特定坐标下相似度大于某一特定阈值的坐标所在位置,并按照相似度大小分别给定不同的演示颜色展示。步骤2)可以按以下步骤执行:第一步:发现频繁项集a.扫描元素,得到每天,每个地点发生事件集合;b.计算概率;c.统计筛选支持度和置信度同时大于阈值的候选集,支持度按公式1计算,置信度按公式2计算:P(AB)关联规则A-B,事件A和事件B同时发生的概率公式1P(B|A)=P(AB)/P(A)在事件A发生的前提下,事件A和事件B同时发生的概率公式2d.产生频繁项集;e.自链接;f.剪枝,即合并后的集合,如果有子集不在原集合中,则把该合并集合删除;g.产生候选集;第二步:产生关联规则。附图说明图1所提方法流程图图2关联问题分析图具体实施方式本专利技术提出了一种利用关联分析算法寻找与已发生的城市问题可能有关联的问题,以帮助城市决策者分析已发生的城市问题,为城市的问题追本溯源以及可能发生的关联问题预测提供了有效方式。同时本专利技术提出了一种为该城市的各个地点寻找发生类似问题的相似地点的方法,为城市决策者统一分析城市问题提供依据。具体步骤如下:1、处理原始数据原始的市民对城市问题反映的数据进行预处理,将数据发生地点的精确度调整为1千米的经度,即城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,即,在一天发生某一城市问题改地点相应属性的位置置为1,否则置为0。通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。事件相关的属性中包括降雨量大,雷雨,气温高等天气类的属性,以及丢井盖,暖气不供暖,水管爆裂等公共设施属性等。2、关联分析事件利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算。通过频繁项集,可对与某一事件有关联的事件按关联度进行排序。具体步骤如下:第一步:发现频繁项集a.扫描元素,得到每天,每个地点发生事件集合。b.计算概率。c.统计筛选支持度和置信度同时大于阈值的候选集,支持度计算公式如公式1所示,置信度计算公式如公式2所示。P(AB)关联规则A-B,事件A和事件B同时发生的概率。公式1P(B|A)=P(AB)/P(A)在事件A发生的前提下,事件A和事件B同时发生的概率。公式2d.产生频繁项集。e.自链接。f.剪枝,即合并后的集合,如果有子集不在原集合中,则把该合并集合删除。g.产生候选集第二步:产生关联规则3、计算事件集相似度某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3所示,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大。其中γ代表相似度,向量代表事件a的各属性值的向量,向量代表事件b的各属性的向量。公式34、可视化事件发生的频繁程度对某一事件按月份、地点统计其发生数目,并利用热力图的方式展示,同时以时间为坐标轴,可通过调整坐标轴动态展示该事件发生的地点、时间以及发生数目多少。同时通过有向图的方式列举出与该事件有关联的事件如图2所示,并按关联度从大到小的排序进行展示。有向图中与原事件之间的连线宽度代表事件之间关联度的大小,关联度越高,连线的宽度值越大;有向图中的原点代表事件的代表事件出现的次数,出现次数越多,原点的值越大。5、可视化相似事件地点分布在某一特定时间下,确定某一特定坐标,计算改坐标发生的事件集合与其他不同坐标位置发生的事件集合的相似度,并按照相似大小进行排序,在地图上列举出与该特定坐标下相似度大于某一特定阈值的坐标所在位置,并按照相似度大小分别给定不同的演示颜色展示。采用Windows7系统,以java作为开发语言。选用城建数据库作为模型训练和测试数据集,选用scikit-learn模块中的Apriori算法模块作为模型训练算法,选用百度地图作为展示图层。通过城市问题关联分析能够有效的找出已发生问题的关联问题,帮助决策者防患其他问题和寻找原问题的根源;通过同时分析不同地点之间的相似问题能够更有效帮助决策者制定整体问题解决方案。本文档来自技高网...

【技术保护点】
1.一种城市问题的可视化分析方法,包括下列步骤:1)处理原始数据对原始的市民对城市问题反映的数据进行预处理,将城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,在一天发生某一城市问题发生地点相应属性的位置置为1,否则置为0;通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。2)关联分析事件利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;第二步:产生关联规则3)计算事件集相似度某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大;

【技术特征摘要】
1.一种城市问题的可视化分析方法,包括下列步骤:1)处理原始数据对原始的市民对城市问题反映的数据进行预处理,将城市问题发生地点的经纬度精确到0.001,对原始数据的事件发生按天进行统计,在一天发生某一城市问题发生地点相应属性的位置置为1,否则置为0;通过处理之后数据库中每一行记录包含内容为:日期,地点,事件1,事件2,...,事件n,n为数据库中已有的事件的相关属性的数目。2)关联分析事件利用Apriori算法,以每天,每个地点发生的事件为数据,进行频繁项集的计算,通过频繁项集,对与某一事件有关联的事件按关联度进行排序;第二步:产生关联规则3)计算事件集相似度某一特定时间,某一地点发生事件集合与其他地点发生事件集合的相似度计算方法,如公式3,通过计算某一特定时间,某一地点发生事件集合与其他各个地点发生事件集合的相似度,然后进行排序,相似度值越大,代表两地点之间发生同类事件集合的相似性越大;其中γ代表相似度,向量代表事件a的各属性值的向量,向量代表事件b的各属性的向量公式34)可视化事件发生的频繁程度对某一事件按月份、地点统计其发生数目,并利用热力图的方式展示,以时间为坐标轴,可通过调整坐标轴动态展示该事件发生的地点、时间...

【专利技术属性】
技术研发人员:夏理超陈锦言
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1