一种考虑用电量使用情况的手机数分布统计方法技术

技术编号:15504387 阅读:67 留言:0更新日期:2017-06-04 00:24
本发明专利技术公开了一种考虑用电量使用情况的手机数分布统计方法,首先对手机基站点状数据进行图形预处理,预处理包括了基站点信息的刷选、合并等。其次,对图形预处理后的手机基站点状数据建立泰森多边形,并将基站所记录的手机数量值分配到相应的泰森多边形中。随后,对按户统计的居民用电量信息进行筛选,并利用地址反解析技术将居民用电量信息转为空间点状图形信息。最后,按照格网统计手机数分布。本发明专利技术实现了结合居民用电量数据,对手机基站中所记录的手机数进行空间分布统计的计算。

A statistical method for the number distribution of mobile phones considering the usage of electricity

The invention discloses a mobile phone number distribution statistical method of electricity usage, the mobile phone base station point data graphics processing, including preprocessing of base station information selection and combination. Secondly, the Tyson polygon is established by the data of the mobile phone base station, and the number of mobile phones recorded by the base station is assigned to the corresponding Tyson polygon. Subsequently, the household electricity consumption information is filtered according to the household statistics, and the residential electricity consumption information is transformed into the spatial point pattern information by using the address reverse analysis technology. Finally, according to the grid statistics, the number of mobile phones is distributed. The invention realizes the calculation of the spatial distribution statistics of the number of mobile phones recorded in the mobile phone base station in combination with the residents' electricity consumption data.

【技术实现步骤摘要】
一种考虑用电量使用情况的手机数分布统计方法
本专利技术涉及手机基站数据处理与城市规划
,特别是一种考虑用电量使用情况的手机数分布统计方法。
技术介绍
目前,随着大数据技术的发展,手机信令数据得到了越来越广泛的使用,如通过手机信令数据模拟出城市居民在城市中不同空间位置的分布状况、结合手机在每个基站的停留时间点长短等信息判断城市主要居住地与工作地的分布、结合城市道路的线路对城市主要交通流量进行判读与分析等。这些应用实践较好地弥补了传统数据所难以观察和处理的问题,为科学城市规划决策提供了一定的依据。但是由于手机基站数据存在以下几个问题:手机基站数据存在着一定的空间精度问题,即由于每个手机所记录的空间位置是基站的空间位置,所以手机所记录的位置并不是实际使用者的空间位置。同时,手机基站在城区大概有300-500米的直线距离间隔,在城市外间隔距离更大,这会导致利用手机信令数据直接模拟人口分布时,会产生较大的空间误差。目前,对于手机信令数据进行人口分布模拟时,主要采用的是核密度法。核密度分析用于计算每个输出栅格像元周围的点要素的密度,概念上,每个点上方均覆盖着一个平滑曲面。在点所在位置处表面值最高,随着与点的距离的增大表面值逐渐减小,在与点的距离等于搜索半径的位置处表面值为零。利用这种方法得出的手机人口分布结果,会明显地与基站的分布相关,这与实际情况是存在一定偏差的,因为人实际所在地与基站一般是具有一定的空间距离,并不一定是围绕基站点来分布的。另外,有些处理方法是将研究区域划分成一定数量等大的格网,然后将基站的所记录下来的手机数均匀地分布到格网里。这种分析方法一方面与格网设置的大小相关,如果太小,基站间隔精度难以满足要求;如果太大,往往会导致分析的价值不大。从目前300-500米的基站间隔来看,在大尺度空间上进行分析时,作用较为明显,而在城市某一区域或者较小城市尺度上,分析的价值并不是很大。另一方面,格网划分时很多时候没有考虑到水域等人类聚集地很低地块的影响,将这些区域也就进行了手机数的分配,进而产生了较大的误差。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的不足而提供一种考虑用电量使用情况的手机数分布统计方法,本专利技术能够通过结合居民用电量数据快速地对手机基站数据模拟出手机数的空间分布状况。本专利技术为解决上述技术问题采用以下技术方案:根据本专利技术提出的一种考虑用电量使用情况的手机数分布统计方法,包括以下步骤:步骤1、对手机基站点状数据进行图形预处理;步骤2、对图形预处理后的手机基站点状数据建立泰森多边形,并将手机基站所记录的手机数分配到相应的泰森多边形中,泰森多边形地块集合记为K;步骤3、根据居民用电量去统计实际居住的家庭户数分布,将全部的居民用户点集合记为D;步骤4、按照格网统计手机数分布,具体如下:步骤4.1、对泰森多边形地块集合K进行遍历,每次遍历过程进行以下处理:将每次遍历所得到的多边形地块与全部的居民用户点集合D进行空间相交处理,如果存在相交的部分,则记录处于相交状态的居民用户点的个数;由此,地块集合K中每个地块便记录了一个相应的居住户数;步骤4.2、K中每个地块都有一个相对应的手机数,将这个手机数除以相应的居住户数,即为这个地块的平均每户手机数;步骤4.3、将待测手机人口分布的区域划分成包含多个网格的格网G,对格网G进行遍历,每次遍历进行以下处理:将遍历得到的单个网格与K进行空间相交计算,得到与此网格相交的多个多边形集合,并计算出每个多边形的手机数,将每个多边形计算得到的手机数相加即为这个格网最终的手机数;所述计算每个多边形的手机数是将每个多边形的平均每户手机数乘以其所包含的户数。作为本专利技术所述的一种考虑用电量使用情况的手机数分布统计方法进一步优化方案,步骤4.3中的每个网格的大小均相同。作为本专利技术所述的一种考虑用电量使用情况的手机数分布统计方法进一步优化方案,所述步骤1中对手机基站点状数据进行图形预处理,具体如下:步骤1.1、选取某个时间点的手机基站点状数据作为分析数据源;步骤1.2、遍历手机基站点状数据,删除记录手机数为0的手机基站点;步骤1.3、如果存在两个手机基站点的地理空间距离小于预设的阈值,则将这两个手机基站点合并为一个手机基站点,且合并后的手机基站点所记录的手机数是这两个手机基站点所记录的手机数之和,合并后手机基站点的空间位置取两个手机基站点的中间位置。作为本专利技术所述的一种考虑用电量使用情况的手机数分布统计方法进一步优化方案,所述某个时间点是在夜间0-5点这个时间段内所选取的某个时间点。作为本专利技术所述的一种考虑用电量使用情况的手机数分布统计方法进一步优化方案,所述步骤3中根据居民用电量去统计实际居住的家庭户数分布,具体如下:步骤3.1、设置针对每户用电量的一个阈值,如果在单位时间内一户家庭的用电量小于这个阈值,则认为此居住户为空置房,并将这条用电量数据删除掉;步骤3.2、利用居民用电量中记录的地址信息,反解析出每户家庭的空间位置所在点,并将全部的居民用户点集合记为D。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:(1)本专利技术提供了一种考虑用电量使用情况的手机数分布统计方法,通过此方法可以对当前手机基站数据进行手机数据的分布统计,并以格网的形式模拟出来;所得分析结果可以为城市规划编制工作提供现状人口分布特征的研究,由于此方法着重考虑了居民用电量实际使用情况的分布,因而,所得结果更加贴近现实的人口分布情况,在精度上有了较大幅度的提升;(2)本专利技术最终结果是采用格网法进行数据组织的,由于方法中每个格网在统计手机数时主要是参考了点状居住用电量数据(通过地址空间反解析转换成为点状数据)的分布情况,所以在利用面状数据(格网)统计点状数据时,统计精度所受到格网大小的影响较小,因此,此方法有效地提高了利用手机基站数据在分析人口空间分布时的精度。另外,单个格网在统计时,也考虑了不同基站的影响。附图说明图1是本专利技术的整体流程示意图。图2是计算每个泰森多边形的平均每户手机数的流程示意图。图3是格网法统计手机数分布的流程示意图。具体实施方式下面结合附图对本专利技术的技术方案做进一步的详细说明:本专利技术提出的一种考虑用电量使用情况的手机数分布统计方法,其主要从以下几个方面考虑了技术设计思路:手机基站一天24个小时都在记录人的空间位置信息,有些时间段可以基本表征出城市居民空间活动的某种相对稳定状态,如在夜间2点,城市居民主要在家里。利用这个相对稳定状稳态可以将研究的范围固定,即利用多日的夜间手机信令数据可以反映了城市常住人口的分布情况,因为只要多日里夜间在这个城市居住就基本可以判断是这个城市的常住人口。泰森多边形是对空间平面的一种剖分,其特点是多边形内的任何位置离该多边形的样点(如手机基站)的距离最近,离相邻多边形内样点的距离远,且每个多边形内含且仅包含一个样点。由于泰森多边形在空间剖分上的等分性特征,因此可用于解决最近点、最小封闭圆等问题。因此,对手机基站数据建立泰森多边形可以较好地将基站的手机信号覆盖范围进行均等化化处理。居民用电量数据是一种客观生成的数据,可以较为真实地反映出城市居住的空置率情况,同时,也是一种较好的城市居民分布的判断标准。本专利技术利用用电量这一重要指标来辅助分析手机用户空间本文档来自技高网
...
一种考虑用电量使用情况的手机数分布统计方法

【技术保护点】
一种考虑用电量使用情况的手机数分布统计方法,其特征在于,包括以下步骤:步骤1、对手机基站点状数据进行图形预处理;步骤2、对图形预处理后的手机基站点状数据建立泰森多边形,并将手机基站所记录的手机数分配到相应的泰森多边形中,泰森多边形地块集合记为K;步骤3、根据居民用电量去统计实际居住的家庭户数分布,将全部的居民用户点集合记为D;步骤4、按照格网统计手机数分布,具体如下:步骤4.1、对泰森多边形地块集合K进行遍历,每次遍历过程进行以下处理:将每次遍历所得到的多边形地块与全部的居民用户点集合D进行空间相交处理,如果存在相交的部分,则记录处于相交状态的居民用户点的个数;由此,地块集合K中每个地块便记录了一个相应的居住户数;步骤4.2、K中每个地块都有一个相对应的手机数,将这个手机数除以相应的居住户数,即为这个地块的平均每户手机数;步骤4.3、将待测手机人口分布的区域划分成包含多个网格的格网G,对格网G进行遍历,每次遍历进行以下处理:将遍历得到的单个网格与K进行空间相交计算,得到与此网格相交的多个多边形集合,并计算出每个多边形的手机数,将每个多边形计算得到的手机数相加即为这个格网最终的手机数;所述计算每个多边形的手机数是将每个多边形的平均每户手机数乘以其所包含的户数。...

【技术特征摘要】
1.一种考虑用电量使用情况的手机数分布统计方法,其特征在于,包括以下步骤:步骤1、对手机基站点状数据进行图形预处理;步骤2、对图形预处理后的手机基站点状数据建立泰森多边形,并将手机基站所记录的手机数分配到相应的泰森多边形中,泰森多边形地块集合记为K;步骤3、根据居民用电量去统计实际居住的家庭户数分布,将全部的居民用户点集合记为D;步骤4、按照格网统计手机数分布,具体如下:步骤4.1、对泰森多边形地块集合K进行遍历,每次遍历过程进行以下处理:将每次遍历所得到的多边形地块与全部的居民用户点集合D进行空间相交处理,如果存在相交的部分,则记录处于相交状态的居民用户点的个数;由此,地块集合K中每个地块便记录了一个相应的居住户数;步骤4.2、K中每个地块都有一个相对应的手机数,将这个手机数除以相应的居住户数,即为这个地块的平均每户手机数;步骤4.3、将待测手机人口分布的区域划分成包含多个网格的格网G,对格网G进行遍历,每次遍历进行以下处理:将遍历得到的单个网格与K进行空间相交计算,得到与此网格相交的多个多边形集合,并计算出每个多边形的手机数,将每个多边形计算得到的手机数相加即为这个格网最终的手机数;所述计算每个多边形的手机数是将每个多边形的平均每户手机数乘以其所包含的户数。2.根据权利要求1所述的一种考虑用...

【专利技术属性】
技术研发人员:韦胜袁锦富刘志超
申请(专利权)人:江苏省城市规划设计研究院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1