一种针对手机基站定位数据的可视分析系统及方法技术方案

技术编号:15864121 阅读:65 留言:0更新日期:2017-07-23 08:53
本发明专利技术涉及一种针对手机基站定位数据的可视分析系统及方法,通过采用结合基于空间简化和时间简化的技术,对手机基站定位数据集进行基站可视化处理、基站间人群流向可视化处理、基于基站的人群流动模式可视化处理和基于时间步的人群流动模式可视化处理,从多个角度展示手机基站定位数据中包含的大量信息。

【技术实现步骤摘要】
一种针对手机基站定位数据的可视分析系统及方法
本专利技术属于信息可视化领域,具体涉及一种针对手机基站定位数据的可视分析系统及方法,用于观察城市中人群的空间分布状况以及人群流动情况,以实现对某地区进行人流监控以及规律分析。
技术介绍
我国是世界上人口最多的国家,随着大数据时代的到来和智慧城市的提出,如何合理的监控、引导和预警大城市或超大城市人口流动状况,提高市民的生活质量,预警特定高密度人口流动区域异常事件的发生,已成为一个亟待解决的实用性课题。随着手机等移动终端的普及,人们从移动通信网络中收集了到大量的数据。手机定位数据作为移动通信网络数据中的一类,在分析人群移动模式、城市功能区识别以及交通网络规划中都提供了很大的帮助。目前,相关领域的很多专家学者都在关注如何利用从移动通信网络中获取的数据来进行可视化研究。在数据可视化中,基于点的可视化重点考虑离散的个体,可以直接显示物体在某一时间点的位置。基于点的表示方法的优势是能够使用户直接观察到数据中的每一个个体,但是当数据量非常庞大时,过多的点会造成画面中相互遮挡和不清楚的问题。现有的流向图是表示物体从一个地方到另一个地方的移动,在地图上的区域之间直接绘制有向边,并用边的宽度或颜色等表示流量大小。传统的流向图直接将所有轨迹绘制在地图上,会造成轨迹间相互遮挡覆盖和不清晰问题。SelassieD等在2011年提出了边捆绑的方法,通过弯曲边让相似的边相互靠近形成一束,以减少相互遮挡。尽管边捆绑可以减少混乱问题,但是在两个位置之间识别实际的连接方向是很困难的。基于手机基站定位的数据集纪录了每个手机用户在不同时刻出现的位置,但从个人的轨迹数据中,很难看出整个城市的整体人群流动情况。现有的一些基于手机定位数据的可视分析系统,能够分析出不同时间段的人群密度,人群流向等特征,但无法展示出每个基站特有的人群流动模式,以及人群移动模式随时间的变化。综上所述,在对手机定位数据可视化中,通过有效的聚类算法可以避免大量数据造成的画面不清晰;通过对数据集进行基于空间上的简化和时间上的简化,可以有针对性的对城市中不同区域、不同时间段的人群移动模式进行可视化。
技术实现思路
本专利技术技术解决问题,克服现有技术的不足,提供一种针对手机基站定位数据的可视分析系统及方法,通过采用结合基于空间简化和时间简化的可视化技术,从多个角度展示手机基站定位数据中包含的大量信息,通过采用结合基于空间简化和时间简化的可视化方法,对城市中的人群流动情况进行可视化。本专利技术技术解决方案:一种面向手机定位数据的可视分析系统,包括数据预处理模块和可视化模块。所述数据预处理模块:可分为数据清洗和数据统计两个步骤。数据清洗是整套手机基站定位数据的基础,其主要功能为:剔除原始数据集中信息不完整有缺失的数据,例如基站经纬度缺失的数据;同时清理会对后续可视化有干扰的信息,例如在手机基站定位数据中影响最大的“乒乓效应”。数据统计是在数据清洗后,为了后续可视化的需要,对现有数据进行统计处理,根据信令产生时间,选择一段特定时间作为固定的时间步,统计每个时间步每个基站内的人数,以及该基站到其他基站的流入、流出人数。所述可视化模块:可分为基站可视化、基站间人群流向可视化、基于基站的人群流动模式可视化和基于时间步的人群流动模式可视化。基站可视化是根据数据集中基站的经纬度,将基站用图标在地图上展示出来。由于基站数量多,直接显示会造成地图上图标过于密集,因此采用一种基于地图分辨率的层次聚类算法对基站进行聚类后,根据地图分辨率直接展示基站聚类后的结果。基站间人群流向可视化采用流向图展示,该部分用于可视化基站间人群流动情况,用线条的粗细表示人群流量的大小。基于基站的人群流动模式可视化,用于展示每个基站聚类在一天中的人群流动情况,用南丁格尔玫瑰图展示一天中各个时间段的人数变化情况。基于时间步的人群流动模式可视化,用于展示不同时间步之间的关系,对于每个时间步,采用基站间的流量作为特征向量,构建每个时间步的特征矩阵,并对此进行聚类,聚为一类的时间步表示这些时间段内,城市中人群流动的模式较为相似,并采用圆环图对其进行可视化。一种针对手机基站定位数据的可视分析方法,使用基于地图比例尺的层次聚类算法对基站进行聚类,根据人群密度或流向分别采用不同的可视化方案。数据预处理模块实现过程如下:A对基于手机基站定位的原始数据集(包括手机用户的唯一标识、经纬度和时间信息,由于数据量很大往往存储在分布式数据仓库中,例如Hive数据仓库),在取出数据导入本地文件时,进行数据预处理,包括:A1)针对基站信息数据集,将基站地点经纬度缺失的数据清除;A2)针对手机定位数据集,消除数据中出现的“乒乓效应”。所谓乒乓效应,在数据表中的表现就是同一个用户在一段很短的时间内(此处设定为10分钟),反复在两个或多个基站间频繁切换的现象。得到清理后的数据集,根据后续可视化的需要,对其进行统计处理,包括:A3)选择一个固定的时间步,例如60分钟,计算每个时间步中各个基站的人数BN={bn1,bn2,…,bnm}(时间步个数为n,基站个数为m);A4)计算每个时间步中,各个基站的人群流动情况,即每个基站到其他基站的流出人数BFi,j,例如从基站C1到基站C2的流出人数为BF1,2,从基站C2到基站C1的流出人数为BF2,1。可视化模块,具体包括以下步骤:B根据上述处理后的数据集进行可视化,包括如下操作:基站可视化具体实现如下:B1)根据不同的地图分辨率R={r1,r2,…,rn},设置不同的地图缩放级别L={l1,l2,…,ln},展示不同分别率的地图。设计一种基于地图分别率的层次聚类算法,对基站进行聚类。针对上述基于地图分辨率的层次聚类算法,该算法是对凝聚层次聚类算法的扩展。所述聚类算法描述如下:step1:有m个基站,设B={b1,b2,…,bm}为所有基站的集合。设置n个地图缩放级别,以下简称为n层,每层对应的分辨率R={r1,r2,…,rn}。设置一个常量c,每层的聚类间最小距离di=c*ri,即距离超过di的基站将不聚为一类。设每层的聚类结果为H={h1,h2,…,hn},hi是在第i层的聚类结果。初始化H为空集。Step2:计算第1层的最大相似距离d1=c*r1,采用凝聚层次聚类算法对B进行聚类。对初始的基站集合B中m个基站作为m个簇,将距离小于d1的最近的两个簇聚为一类,然后更新集合B,此时集合内簇的个数为m-1;对更新的集合B中继续将距离小于d1的最近的两个簇聚为一类,再更新集合B,此时集合内簇的个数为m-2;重复上述步骤,直至所有簇间距离均大于d1。最终聚类结果为h1;Step3:计算第2层的最大相似距离d2=c*r2,采用相同凝聚层次聚类算法算法对上一层的结果h1进行聚类,结果为h2;Step4:计算第i层的最大相似距离di=c*ri,采用相同凝聚层次聚类算法算法对上一层的结果hi-1进行聚类,结果为hi;Step5:重复step4直到得到所有层的聚类结果。B2)在地图上根据不同的缩放级别对基站进行可视化,包括如下操作:B21)采用聚类中包含的所有基站的坐标平均值作为该基站聚类的坐标,计算该聚类所包含的基站数量,在基站图标上显示出具体数值。B22)根据所选时段中,该基站聚类(聚本文档来自技高网
...
一种针对手机基站定位数据的可视分析系统及方法

【技术保护点】
一种针对手机基站定位数据的可视分析系统,其特征在于:包括数据预处理模块和可视化模块;所述数据预处理模块,对手机定位基站定位得到的数据集进行数据清洗和数据统计,得到预处理后的数据集;所述数据集包括手机定位数据集和基站信息数据集,手机定位数据集包括手机用户的唯一标识、信令产生的时间、以及用户所在基站的编号;基站信息数据集包括基站编号和基站所在地点经纬度;所述可视化模块,对数据预处理模块处理后的数据集分别进行基站可视化处理、基站间人群流向可视化处理、基于基站的人群流动模式可视化处理和基于时间步的人群流动模式可视化处理;基站可视化处理采用基于地图分别率的层次聚类算法对基站进行聚类,得到聚类结果;根据聚类结果,在地图上根据不同的缩放级别对基站进行可视化;基站间人群流向可视化处理绘制流向图,对不同时刻人群的流动方向及流量大小进行可视化;基于基站的人群流动模式可视化处理计算各个基站聚类每个时间步的净流入人数,通过绘制南丁格尔玫瑰图,对每个基站聚类一天中各个时间段的人数变化情况进行可视化;基于时间步的人群流动模式可视化处理根据每个时间步对应的基站聚类间人群流量大小,对时间步进行聚类,得到人群流动模式相似的时间步被聚为一类,并用图进行可视化,能够帮助分析不同时间步之间的关系。...

【技术特征摘要】
1.一种针对手机基站定位数据的可视分析系统,其特征在于:包括数据预处理模块和可视化模块;所述数据预处理模块,对手机定位基站定位得到的数据集进行数据清洗和数据统计,得到预处理后的数据集;所述数据集包括手机定位数据集和基站信息数据集,手机定位数据集包括手机用户的唯一标识、信令产生的时间、以及用户所在基站的编号;基站信息数据集包括基站编号和基站所在地点经纬度;所述可视化模块,对数据预处理模块处理后的数据集分别进行基站可视化处理、基站间人群流向可视化处理、基于基站的人群流动模式可视化处理和基于时间步的人群流动模式可视化处理;基站可视化处理采用基于地图分别率的层次聚类算法对基站进行聚类,得到聚类结果;根据聚类结果,在地图上根据不同的缩放级别对基站进行可视化;基站间人群流向可视化处理绘制流向图,对不同时刻人群的流动方向及流量大小进行可视化;基于基站的人群流动模式可视化处理计算各个基站聚类每个时间步的净流入人数,通过绘制南丁格尔玫瑰图,对每个基站聚类一天中各个时间段的人数变化情况进行可视化;基于时间步的人群流动模式可视化处理根据每个时间步对应的基站聚类间人群流量大小,对时间步进行聚类,得到人群流动模式相似的时间步被聚为一类,并用图进行可视化,能够帮助分析不同时间步之间的关系。2.根据权利要求1所述的针对手机基站定位数据的可视分析系统,其特征在于:所述数据预处理模块中,数据清洗步骤如下:(1)针对基站信息数据集,将基站地点经纬度缺失的数据清除;针对手机定位数据集,消除手机用户时间信息的数据中出现的乒乓效应,所述乒乓效应在数据表中的表现就是同一个用户在10分钟之内,反复在两个或多个基站间频繁切换的现象;最后得到预处理后的数据集;(2)得到预处理后的数据集,根据后续可视化的需要,进行统计处理,统计处理过程为:选择一个固定的时间步,计算每个时间步中各个基站的人数:BN={bn1,bn2,…,bnm},时间步个数为n,基站个数为m;然后计算每个时间步中,各个基站的人群流动情况,即每个基站到其他基站的流出人数,基站i到基站j的流出人数表示为BFi,j。3.根据权利要求1所述的针对手机基站定位数据的可视分析系统,其特征在于:所述可视化模块中,基站可视化处理具体包括以下步骤:(1)根据不同的地图分辨率R={r1,r2,…,rn},设置不同的地图缩放级别L={l1,l2,…,ln},展示不同分别率的地图,设计一种基于地图分别率的层次聚类算法,对基站进行聚类,所述聚类算法描述如下:step1:有m个基站,设B={b1,b2,…,bm}为所有基站的集合,设置n个地图缩放级别,以下简称为n层,每层对应的分辨率R={r1,r2,…,rn},设置一个常量c,每层的聚类间最小距离di=c*ri,即距离超过di的基站将不聚为一类,设每层的聚类结果为H={h1,h2,…,hn},hi是在第i层的聚类结果,初始化H为空集;Step2:计算第1层的最大相似距离d1=c*r1,采用凝聚层次聚类算法对B进行聚类。对初始的基站集合B中m个基站作为m个簇,将距离小于d1的最近的两个簇聚为一类,然后更新集合B,此时集合内簇的个数为m-1;对更新的集合B中继续将距离小于d1的最近的两个簇聚为一类,再更新集合B,此时集合内簇的个数为m-2;重复上述步骤,直至所有簇间距离均大于d1,最终聚类结果为h1;Step3:计算第2层的最大相似距离d2=c*r2,采用相同凝聚层次聚类算法对上一层的结果h1进行聚类,结果为h2;Step4:计算第i层的最大相似距离di=c*ri,采用相同凝聚层次聚类算法对上一层的结果hi-1进行聚类,结果为hi;Step5:重复step4直到得到所有层的聚类结果;(2)根据聚类结果,在地图上根据不同的缩放级别对基站进行可视化,包括如下操作:(21)采用聚类中包含的所有基站的坐标平均值作为该基站聚类的坐标,计算该聚类所包含的基站数量,在基站图标上显示出具体数值;(22)根据所选时段中,该基站聚类的流入人数多于流出人数,或流出人数多于流入人数,采用不同颜色进行区分;(23)采用多视图协同的可视化方法,对于某个基站聚类,绘制折线图表示基站聚类流入、流出及当前时刻总人数随时间的变化。4.根据权利要求1所述的针对手机基站定位数据的...

【专利技术属性】
技术研发人员:李海生宋璇黄媛洁蔡强李楠
申请(专利权)人:北京工商大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1