一种基于移动电话数据识别城市特定区域的方法技术

技术编号:16331831 阅读:159 留言:0更新日期:2017-10-01 23:48
本发明专利技术公开了一种基于移动电话数据识别城市特定区域的方法,包括:(1)对移动基站网络进行Vinornoi分割;(2)统计移动基站网络中每个基站的邻基站集合,得到基站邻接矩阵;(3)利用Hadoop集群的负载均衡将数据分割成大小相同的若干分片;(4)根据用户标识和时间顺序,得到每个用户的轨迹路线;(5)抽取每个用户的地理位置发生变化的迁移;(6)根据得到的起始点区域和终止点区域,合并所有的迁移。(7)在Hadoop中统计所有(起始点,终止点,时间)三元组合的个数,得到通话迁移矩阵;(8)利用基站邻接矩阵和通话迁移矩阵识别城市中的特定区域。本发明专利技术可以根据用户的移动特征反映地理属性,识别城市的特定区域。

Method for identifying city specific area based on mobile phone data

The invention discloses a method for identifying mobile phone data, city specific areas include: (1) based on the Vinornoi segmentation of the mobile base station network; (2) a collection of neighboring base stations of each base station statistics mobile base stations in the network, the base station by adjacency matrix; (3) using the Hadoop cluster load balancing to partition the data into size some pieces of the same; (4) according to the user identification and time sequence, get the path of each user; (5) migration from each user's location changes; (6) according to the starting point and end point of the regional area, with all the migration. (7) in Hadoop, count the number of all (starting point, termination point, time) three element combination, and get the call transfer matrix; (8) identify the specific region of the city by using the base station adjacency matrix and call transfer matrix. The invention can reflect the geographical attribute according to the moving characteristic of the user, and identify the specific area of the city.

【技术实现步骤摘要】

本专利技术涉及移动数据挖掘技术,具体涉及一种基于移动电话数据识别城市特定区域的方法
技术介绍
移动终端设备的应用大大方便了人们的生活,相比于传统的有线电话网络,移动手机终端具有携带方便,移动范围广泛的特点,而且能够长时间反映用户的基本信息。随着3G网络的广泛使用,用户不仅仅有基本的语音和短信业务,还能使用数据流量业务。正因为移动终端设备方便携带,同时集众多功能于一身,移动业务已经广泛存在于生活当中。一般而言,一个简单的移动网络由移动终端,通信基站和承载网络组成。对于手机运营商而言,该网络不仅可以用于普通的计费,而且可以得到用户的通话时间和时长、通话对方、通话地点等信息。此丰富信息能够反映用户的地理移动特征和生活习惯,因而可以用于建设“智慧城市”,创造更加智能的生活环境,比如可以被用于分析交通堵塞的问题、局部区域的广告信息投放、用户和兴趣推荐、移动社交网络的发展以及划分用户类型等。
技术实现思路
鉴于此,本专利技术的目的在于提出一种基于移动电话数据识别城市特定区域的方法,该方法可以根据用户的移动特征反映地理属性,识别城市的特定区域。为实现以上专利技术目的,本专利技术采用以下技术方案:一种基于移动电话数据识别城市特定区域的方法,包括以下步骤:(1)假定各个基站的覆盖范围互不相交,对移动基站网络进行Vinornoi分割;(2)统计移动基站网络中每个基站的邻基站集合,得到基站邻接矩阵;(3)利用Hadoop集群的负载均衡将数据分割成大小相同的若干分片;(4)根据用户标识(prd)和时间顺序,得到每个用户的轨迹路线;(5)抽取每个用户的地理位置发生变化的迁移,该迁移包含有起始点和终止点的区域范围以及时间信息;(6)根据得到的起始点区域和终止点区域,合并所有的迁移。(7)在Hadoop中统计所有(起始点,终止点,时间)三元组合的个数,得到维度为基站总数量的通话迁移矩阵(TransitionMatrix);(8)利用基站邻接矩阵和通话迁移矩阵识别城市中的特定区域。本专利技术具有以下有益效果:可以根据用户的移动特征反映地理属性,识别城市的特定区域,并进一步用于分析交通堵塞、局部区域的广告信息投放、用户和兴趣推荐、移动社交网络的发展以及划分用户类型等问题。附图说明参照下面的说明,结合附图,可以对本专利技术有最佳的理解。在附图中,相同的部分可由相同的标号表示。图1是本专利技术较优实施例的整体流程示意图;图2是对一个基站网络作Vinornoi分割的示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及示例性实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的示例性实施例仅用以解释本专利技术,并不用于限定本专利技术的适用范围。数据准备用户通话数据,主要包含以下字段:用户id用户呼叫时间(发起电话或接听电话)基站cellid通话时长这些数据能够反映用户的通话习惯和移动模式,以上的数据存放在Hadoop数据库中,数据量至少为千万条。根据基站cellid得到地理位置根据通话数据中反映基站的标识cellid,在工参表中查询到基站所处的地理经纬度。一个基站的覆盖面积较大,用户打电话的地理位置不能仅依靠该地理位置。通过工参表中对应基站的其他参数,如辐射角,波束方向等信息进行定位,可以大致分析出用户所在的位置,具有较好的精度。此外,通话过程中,因为基站的跳变和负载均衡,基站的位置可能和实际的地理位置有偏差,此时可以用用户常出现位置的概率和地点变换之间的时间差来估计用户实际所处的地理范围。通过以上方法,可以得到基站之间的距离和是否相邻以及用户较为精确的行为轨迹等信息。把用户在各个基站间的移动作为联系基站间的桥梁,根据用户的行为模式得到区域的功能属性分类,进而分析局部区域的特性。特性定义轨迹:一个移动用户在一段时间里移动的地理位置按时间排序,得到一组连续的地理位置序列。比如移动用户user早上起床后在A处打了电话,之后上公交路上B接到了他人的电话,到达公司C后给其他部分给了若干各电话通知。那么这段时间里该用户user的轨迹则为在时间上按序排列的(A,tA)-(B,tB)-(C,tC1)-(C,tC2)。迁移(Transition):表明移动用户在地理位置上的变化,反映了通话流量在不同地点间的流动,是一个由起点、终点和时间表示的组合。根据以上的轨迹定义,得到形如[(A,tA),(B,tB)]、[(B,tB),(C,tC1)]的组合,因为[(C,tC1),(C,tC2)]发生的地点没有改变,该组合不属于迁移的定义。地理邻居(SpatialNeighbors):根据基站覆盖图可知,每个基站周围都有若干个邻居,这些邻居基站和中心基站构成了GSM的蜂窝网络。因为地理位置上是相邻的,因此将这些邻居定义为地理邻居SpatialNeighbors,这些SpatialNeighbors的个数为Ni。时间邻居(Temporalneighbors):由移动用户的迁移图可知,用户的移动模式可能发生在地域上不相邻的位置,定义用户迁移的基站组合为时间上的邻居Temporalneighbors。也即,用户从起始点到终止点,如果在时间上跨度很紧密,那么这两个地方就是时间邻居。根据以上定义,可以得到移动用户轨迹网络图G(V,E),其中V表示基站的覆盖范围,E表示用户的迁移(Transition)。移动用户在一段时间(例如一天、一个星期、半个月或者一个月等)的轨迹图则可以用带权重的一系列Trace=(E,Weight)来表示。通过分析群体用户在不同时间段上的迁移规律,可以得到群体用户的移动模式。所谓移动模式,是反映用户群体使用移动电话在地理上的迁移特性。这种特性可能是由于城市中的特定区域(例如地理位置上的不通畅)造成的,因此,利用人们的这种移动模式可以识别城市的特定区域。在以上原理介绍的基础上,参见图1,下面详细说明本专利技术提出的一种基于移动电话数据识别城市特定区域的方法,包括以下步骤:(1)假定各个基站的覆盖范围互不相交,对移动基站网络进行Vinornoi分割。在移动网络中,一般而言,移动用户的接入和通话都由附近的基站负责。由于不同地点人群的密集程度不同和手机信号的切换,一个基站信号的覆盖范围有大有小,甚至还有宏基站和蜂窝基站同时存在,因此,移动用户设备接入时,会收到来自周围的多个本文档来自技高网...

【技术保护点】
一种基于移动电话数据识别城市特定区域的方法,包括以下步骤:(1)假定各个基站的覆盖范围互不相交,对移动基站网络进行Vinornoi分割;(2)统计移动基站网络中每个基站的邻基站集合,得到基站邻接矩阵;(3)利用Hadoop集群的负载均衡将数据分割成大小相同的若干分片;(4)根据用户标识(prd)和时间顺序,得到每个用户的轨迹路线;(5)抽取每个用户的地理位置发生变化的迁移,该迁移包含有起始点和终止点的区域范围以及时间信息;(6)根据得到的起始点区域和终止点区域,合并所有的迁移;(7)在Hadoop中统计所有(起始点,终止点,时间)三元组合的个数,得到维度为基站总数量的通话迁移矩阵(Transition Matrix);(8)利用基站邻接矩阵和通话迁移矩阵识别城市中的特定区域。

【技术特征摘要】
1.一种基于移动电话数据识别城市特定区域的方法,包括以下步
骤:
(1)假定各个基站的覆盖范围互不相交,对移动基站网络进行
Vinornoi分割;
(2)统计移动基站网络中每个基站的邻基站集合,得到基站邻接矩
阵;
(3)利用Hadoop集群的负载均衡将数据分割成大小相同的若干分片;
(4)根据用户标识(prd)和时间顺序,得到每个用户的轨迹路线;
(5)抽取每个用户的地理位置发生变化的迁移,该迁移包含有起始点
和终止点的区域范围以及时间信息;
(6)根据得到的起始点区域和终止点区域,合并所有的迁移;
(7)在Hadoop中统计所有(起始点,终止点,时间)三元组合的个数,
得到维度为基站总数量的通话迁移矩阵(TransitionMatrix);

【专利技术属性】
技术研发人员:向峰涂来黄本雄方宸
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1