【技术实现步骤摘要】
一种针对手机基站定位数据的可视分析系统及方法
本专利技术属于信息可视化领域,具体涉及一种针对手机基站定位数据的可视分析系统及方法,用于观察城市中人群的空间分布状况以及人群流动情况,以实现对某地区进行人流监控以及规律分析。
技术介绍
我国是世界上人口最多的国家,随着大数据时代的到来和智慧城市的提出,如何合理的监控、引导和预警大城市或超大城市人口流动状况,提高市民的生活质量,预警特定高密度人口流动区域异常事件的发生,已成为一个亟待解决的实用性课题。随着手机等移动终端的普及,人们从移动通信网络中收集了到大量的数据。手机定位数据作为移动通信网络数据中的一类,在分析人群移动模式、城市功能区识别以及交通网络规划中都提供了很大的帮助。目前,相关领域的很多专家学者都在关注如何利用从移动通信网络中获取的数据来进行可视化研究。在数据可视化中,基于点的可视化重点考虑离散的个体,可以直接显示物体在某一时间点的位置。基于点的表示方法的优势是能够使用户直接观察到数据中的每一个个体,但是当数据量非常庞大时,过多的点会造成画面中相互遮挡和不清楚的问题。现有的流向图是表示物体从一个地方到另一个地方的移动,在地图上的区域之间直接绘制有向边,并用边的宽度或颜色等表示流量大小。传统的流向图直接将所有轨迹绘制在地图上,会造成轨迹间相互遮挡覆盖和不清晰问题。SelassieD等在2011年提出了边捆绑的方法,通过弯曲边让相似的边相互靠近形成一束,以减少相互遮挡。尽管边捆绑可以减少混乱问题,但是在两个位置之间识别实际的连接方向是很困难的。基于手机基站定位的数据集纪录了每个手机用户在不同时刻出现的位置, ...
【技术保护点】
一种针对手机基站定位数据的可视分析系统,其特征在于:包括数据预处理模块和可视化模块;所述数据预处理模块,对手机定位基站定位得到的数据集进行数据清洗和数据统计,得到预处理后的数据集;所述数据集包括手机定位数据集和基站信息数据集,手机定位数据集包括手机用户的唯一标识、信令产生的时间、以及用户所在基站的编号;基站信息数据集包括基站编号和基站所在地点经纬度;所述可视化模块,对数据预处理模块处理后的数据集分别进行基站可视化处理、基站间人群流向可视化处理、基于基站的人群流动模式可视化处理和基于时间步的人群流动模式可视化处理;基站可视化处理采用基于地图分别率的层次聚类算法对基站进行聚类,得到聚类结果;根据聚类结果,在地图上根据不同的缩放级别对基站进行可视化;基站间人群流向可视化处理绘制流向图,对不同时刻人群的流动方向及流量大小进行可视化;基于基站的人群流动模式可视化处理计算各个基站聚类每个时间步的净流入人数,通过绘制南丁格尔玫瑰图,对每个基站聚类一天中各个时间段的人数变化情况进行可视化;基于时间步的人群流动模式可视化处理根据每个时间步对应的基站聚类间人群流量大小,对时间步进行聚类,得到人群流动模式相 ...
【技术特征摘要】
1.一种针对手机基站定位数据的可视分析系统,其特征在于:包括数据预处理模块和可视化模块;所述数据预处理模块,对手机定位基站定位得到的数据集进行数据清洗和数据统计,得到预处理后的数据集;所述数据集包括手机定位数据集和基站信息数据集,手机定位数据集包括手机用户的唯一标识、信令产生的时间、以及用户所在基站的编号;基站信息数据集包括基站编号和基站所在地点经纬度;所述可视化模块,对数据预处理模块处理后的数据集分别进行基站可视化处理、基站间人群流向可视化处理、基于基站的人群流动模式可视化处理和基于时间步的人群流动模式可视化处理;基站可视化处理采用基于地图分别率的层次聚类算法对基站进行聚类,得到聚类结果;根据聚类结果,在地图上根据不同的缩放级别对基站进行可视化;基站间人群流向可视化处理绘制流向图,对不同时刻人群的流动方向及流量大小进行可视化;基于基站的人群流动模式可视化处理计算各个基站聚类每个时间步的净流入人数,通过绘制南丁格尔玫瑰图,对每个基站聚类一天中各个时间段的人数变化情况进行可视化;基于时间步的人群流动模式可视化处理根据每个时间步对应的基站聚类间人群流量大小,对时间步进行聚类,得到人群流动模式相似的时间步被聚为一类,并用图进行可视化,能够帮助分析不同时间步之间的关系。2.根据权利要求1所述的针对手机基站定位数据的可视分析系统,其特征在于:所述数据预处理模块中,数据清洗步骤如下:(1)针对基站信息数据集,将基站地点经纬度缺失的数据清除;针对手机定位数据集,消除手机用户时间信息的数据中出现的乒乓效应,所述乒乓效应在数据表中的表现就是同一个用户在10分钟之内,反复在两个或多个基站间频繁切换的现象;最后得到预处理后的数据集;(2)得到预处理后的数据集,根据后续可视化的需要,进行统计处理,统计处理过程为:选择一个固定的时间步,计算每个时间步中各个基站的人数:BN={bn1,bn2,…,bnm},时间步个数为n,基站个数为m;然后计算每个时间步中,各个基站的人群流动情况,即每个基站到其他基站的流出人数,基站i到基站j的流出人数表示为BFi,j。3.根据权利要求1所述的针对手机基站定位数据的可视分析系统,其特征在于:所述可视化模块中,基站可视化处理具体包括以下步骤:(1)根据不同的地图分辨率R={r1,r2,…,rn},设置不同的地图缩放级别L={l1,l2,…,ln},展示不同分别率的地图,设计一种基于地图分别率的层次聚类算法,对基站进行聚类,所述聚类算法描述如下:step1:有m个基站,设B={b1,b2,…,bm}为所有基站的集合,设置n个地图缩放级别,以下简称为n层,每层对应的分辨率R={r1,r2,…,rn},设置一个常量c,每层的聚类间最小距离di=c*ri,即距离超过di的基站将不聚为一类,设每层的聚类结果为H={h1,h2,…,hn},hi是在第i层的聚类结果,初始化H为空集;Step2:计算第1层的最大相似距离d1=c*r1,采用凝聚层次聚类算法对B进行聚类。对初始的基站集合B中m个基站作为m个簇,将距离小于d1的最近的两个簇聚为一类,然后更新集合B,此时集合内簇的个数为m-1;对更新的集合B中继续将距离小于d1的最近的两个簇聚为一类,再更新集合B,此时集合内簇的个数为m-2;重复上述步骤,直至所有簇间距离均大于d1,最终聚类结果为h1;Step3:计算第2层的最大相似距离d2=c*r2,采用相同凝聚层次聚类算法对上一层的结果h1进行聚类,结果为h2;Step4:计算第i层的最大相似距离di=c*ri,采用相同凝聚层次聚类算法对上一层的结果hi-1进行聚类,结果为hi;Step5:重复step4直到得到所有层的聚类结果;(2)根据聚类结果,在地图上根据不同的缩放级别对基站进行可视化,包括如下操作:(21)采用聚类中包含的所有基站的坐标平均值作为该基站聚类的坐标,计算该聚类所包含的基站数量,在基站图标上显示出具体数值;(22)根据所选时段中,该基站聚类的流入人数多于流出人数,或流出人数多于流入人数,采用不同颜色进行区分;(23)采用多视图协同的可视化方法,对于某个基站聚类,绘制折线图表示基站聚类流入、流出及当前时刻总人数随时间的变化。4.根据权利要求1所述的针对手机基站定位数据的...
【专利技术属性】
技术研发人员:李海生,宋璇,黄媛洁,蔡强,李楠,
申请(专利权)人:北京工商大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。