一种基于手机大数据的城市间迁移客流分析方法技术

技术编号:13953767 阅读:79 留言:0更新日期:2016-11-02 09:52
本发明专利技术提供了一种基于手机大数据的城市间迁移客流分析方法。本发明专利技术对海量手机大数据进行处理和筛选,构建个体出行的时空序列数据,通过聚类分析结合判别规则对个体迁移流动过程中的出行方式和各城市的功能进行判定,分析人口地区间流动的格局和趋势,以及各城市在其中所扮演的角色。

【技术实现步骤摘要】

本专利技术涉及一种基于海量匿名加密手机个体时间序列定位数据的人口跨城市迁移流动行为分析方法,根据个体的时间和空间位置数据构建个体出行时空序列数据,设置判别规则判定其出行起始城市-目的地城市,并对个体长期的空间移动序列进行裁剪,对其行进速度进行聚类,判别出行路径中的中间节点城市和过境点城市,对其出行方式进行判断。本专利技术可以用于获取人口在城市间的迁移流动规律和现状特征,以及各城市在人口迁移过程中地位和作用,为交通政策评估、交通规划,以及多区域人口、资源和环境管理和协调发展提供服务,属于区域决策规划与经济管理的

技术介绍
城市间人口迁移流动是国民经济活动中的重要行为,历来受到经济学、人口学、地理学、资源环境科学、区域规划,及其相关的多种交叉学科的重视,历经了数百年的讨论和研究,衍生出了大量的模型、方法,产生了很多划时代的结论。但仍存在许多不足之处。早期关于人口跨地区迁移流动的科学研究主要兴起于古典经济学的发展,从而衍生出大量关于人口迁移的数理模型。但由于计算工具的不足,这些模型的结构基本都以自上而下为主(up-down),大多具有非常强硬的外生假设(如福利最大化假设、工资率均衡假设等),往往与现实产生较大的出入,导致结果徒具理论意义,而较难与现实情况符合。随着计算机技术的大力发展,出现了大量充分发挥计算机高速计算能力的可计算自底向上模型(bottom-up)。尤其是面向对象模拟(object-oriented simulation)方法的崛起,使得对于人口迁移的研究进入计算机建模的时代。近年来,随着微观模拟(micro simulation)、基于Agent模拟(agent-based simulation)方法的发展,对人口迁移流动的研究开始细化到对个体微观行为模式的建模。此时,早期限制模型发展的数学工具和计算能力已不再成为主要制约因素,而数据的缺失成为模型发展的桎梏。传统的对于人口区域间迁移的研究分析主要基于人口普查数据中的地区人口净迁入数据。但是该数据统计尺度较粗,且只有人口的净变化值,对于人口具 体的迁移方向和迁移路径并无记录。此外,也有根据民航局和交通部在统计年鉴或其他数据来源中给出的客流交通运输量进行估算的。这些数据同样存在统计尺度较粗的问题,同时其主要统计的民航和铁路运输主要服务远途出行,而无法统计短途的自驾出行。近年来,随着信息技术的发展,数据信息量呈现爆炸式增长,而对于人口迁移和流动行为,其数据来源越来越多,数据量也越来越庞大。本专利技术基于手机大数据分析城市间人家迁移流动行为,将迁移流动行为的研究对象精确细致到迁移行为的实际发生者本身。至2015年,手机用户达到13.06亿,占到总人口的96%以上,手机终端设备持续产生的信号信息,形成了记录用户出行的一系列数据集,为人口迁移流动分析提供数据来源。但可获得的手机数据质量参差不齐,这就需要对大数据进行数据挖掘和处理。
技术实现思路
本专利技术的目的是利用移动终端个体在指定时间范围内的空间活动数据集,挖掘大量个体的出行时空序列数据,分析个体的出行方式和各城市在迁移流动活动中的角色,并对这些行为进行时空范围的统计,从而真实客观地反映出人口在城市间的迁移流动格局和趋势。为了达到上述目的,本专利技术的技术方案是提供了一种基于手机大数据的城市间迁移客流分析方法,其特征在于,包括以下步骤:步骤1、从通信运营商获取不同城市的在时间与空间上连续的匿名加密手机数据,对每个EPID而言,依据当前EPID的匿名加密手机数据计算得到指定时间段内的各手机数据对应的真实经度坐标LON及真实纬度坐标LAT,将不同的城市定义为不同的区域LOC,根据计算得到的所有的真实经度坐标LON及真实纬度坐标LAT,获得当前EPID在指定时间段内所处的区域LOC的个数,剔除区域LOC的个数不大于1个的所有EPID,则得到在指定时间段内所有跨城市的EPID,并将这些跨城市的EPID记录入目标数据库;步骤2、根据目标数据库中每个EPID在指定时间段内的全部通信记录,以区域LOC为空间划分单位,将当前EPID在每个区域LOC内的通信活动发生的时间进行排序,形成当前EPID在每个区域LOC内通信行为的时间轴;在此基础上,通过时间轴每一条记录中的真实经度坐标LON及真实纬度坐标LAT,进 行地理映射,根据其经纬度坐标投射到地理空间,生成时空数据;利用地理邻接网络对时空数据进行空间连续性检验;计算时空数据中每一时间段的时长与该段路径理论上的长度,以此计算用户在该段的行进速度,获得用户出行时空序列组,包括以下步骤步骤2.1、遍历已存入目标数据库的满足跨城市出行条件的EPID,在目标数据库中查找指定时间段内当前EPID的所有记录,将每条记录中的相应信息与地理数据进行匹配,将每条记录作为一个数据点落到实际地图中,每个数据点至少包括:EPID、记录发生时间TIME、真实经度坐标LON、真实纬度坐标LAT、区域LOC;步骤2.2、以区域LOC为单位,查找当前EPID在指定时间段内段内在各个区域LOC中被记录的第一条通信记录FirstRec所对应的数据点作为一个节点和最后一条通信记录LastRec所对应的数据点作为一个节点,并根据每条通信记录的发生时间对得到的节点进行排序,构建路段数据,路段数据中的字段至少包括:路段始节点LNODE、路段终节点NNODE、经过该路段花费的时间TIME,路段数据和节点数据共同形成全时空序列数据;步骤2.3、遍历全时空序列数据,标记其中的出发地-目的地节点;步骤2.4、将当前EPID的全时空序列数据根据出发地-目的地节点进行裁剪,形成多条仅有首尾节点是出发地-目的地节点的单次出行时间序列;步骤2.5、结合城际铁路网和三级公路网数据或城市间邻接矩阵提取出路段数据的直线距离、公路距离和铁路距离,即为路径长度DISTANCE;步骤2.6、利用路径长度DISTANCE和时间TIME,计算得到每个路段的进行速度SPEED,并将进行速度SPEED加入单次出行时间序列中,当步骤2.5中使用的是城际铁路网和三级公路网数据时,获得三种速度:直线速度SPEED-S、高铁速度SPEED-H和公路网速度SPEED-R;当步骤2.5中使用的是城市间邻接矩阵时,获得二种速度:直线速度SPEED-S、邻接矩阵速度SPEED-M;步骤3、根据当前EPID的单次出行时间序列中的进行速度SPEED判别非出发地-目的地节点的节点类型,并以此最终确定当前EPID的出行方式,包括以下步骤:步骤3.1、首先对当前EPID的单次出行时间序列上各路段的进行速度SPEED 进行聚类,选出速度明显较低的路段作为速度异常路段;步骤3.2、根据速度异常段的首节点LNODE和尾节点NNODE,满足下列条件之一,则将速度异常路段所在城市判断为中间节点:条件一、若速度异常路段的首节点LNODE和尾节点NNODE在同一城市,则标记该城市为中间节点;条件二、若速度异常路段的首节点LNODE和尾节点NNODE不在同一城市内,则依据速度异常路段在首节点LNODE和尾节点NNODE城市的长度,取距离长者对应的城市作为中间节点;若速度异常路段横跨多地,其首节点LNODE和尾节点NNODE在空间上不邻接,则无法判别其中哪一个节点为中间节点,放弃标注或本文档来自技高网
...

【技术保护点】
一种基于手机大数据的城市间迁移客流分析方法,其特征在于,包括以下步骤:步骤1、从通信运营商获取不同城市的在时间与空间上连续的匿名加密手机数据,对每个EPID而言,依据当前EPID的匿名加密手机数据计算得到指定时间段内的各手机数据对应的真实经度坐标LON及真实纬度坐标LAT,将不同的城市定义为不同的区域LOC,根据计算得到的所有的真实经度坐标LON及真实纬度坐标LAT,获得当前EPID在指定时间段内所处的区域LOC的个数,剔除区域LOC的个数不大于1个的所有EPID,则得到在指定时间段内所有跨城市的EPID,并将这些跨城市的EPID记录入目标数据库;步骤2、根据目标数据库中每个EPID在指定时间段内的全部通信记录,以区域LOC为空间划分单位,将当前EPID在每个区域LOC内的通信活动发生的时间进行排序,形成当前EPID在每个区域LOC内通信行为的时间轴;在此基础上,通过时间轴每一条记录中的真实经度坐标LON及真实纬度坐标LAT,进行地理映射,根据其经纬度坐标投射到地理空间,生成时空数据;利用地理邻接网络对时空数据进行空间连续性检验;计算时空数据中每一时间段的时长与该段路径理论上的长度,以此计算用户在该段的行进速度,获得用户出行时空序列组,包括以下步骤步骤2.1、遍历已存入目标数据库的满足跨城市出行条件的EPID,在目标数据库中查找指定时间段内当前EPID的所有记录,将每条记录中的相应信息与地理数据进行匹配,将每条记录作为一个数据点落到实际地图中,每个数据点至少包括:EPID、记录发生时间TIME、真实经度坐标LON、真实纬度坐标LAT、区域LOC;步骤2.2、以区域LOC为单位,查找当前EPID在指定时间段内段内在各个区域LOC中被记录的第一条通信记录FirstRec所对应的数据点作为一个节点和最后一条通信记录LastRec所对应的数据点作为一个节点,并根据每条通信记录的发生时间对得到的节点进行排序,构建路段数据,路段数据中的字段至少包括:路段始节点LNODE、路段终节点NNODE、经过该路段花费的时间TIME,路段数据和节点数据共同形成全时空序列数据;步骤2.3、遍历全时空序列数据,标记其中的出发地‑目的地节点;步骤2.4、将当前EPID的全时空序列数据根据出发地‑目的地节点进行裁剪,形成多条仅有首尾节点是出发地‑目的地节点的单次出行时间序列;步骤2.5、结合城际铁路网和三级公路网数据或城市间邻接矩阵提取出路段数据的直线距离、公路距离和铁路距离,即为路径长度DISTANCE;步骤2.6、利用路径长度DISTANCE和时间TIME,计算得到每个路段的进行速度SPEED,并将进行速度SPEED加入单次出行时间序列中,当步骤2.5中使用的是城际铁路网和三级公路网数据时,获得三种速度:直线速度SPEED‑S、高铁速度SPEED‑H和公路网速度SPEED‑R;当步骤2.5中使用的是城市间邻接矩阵时,获得二种速度:直线速度SPEED‑S、邻接矩阵速度SPEED‑M;步骤3、根据当前EPID的单次出行时间序列中的进行速度SPEED判别非出发地‑目的地节点的节点类型,并以此最终确定当前EPID的出行方式,包括以下步骤:步骤3.1、首先对当前EPID的单次出行时间序列上各路段的进行速度SPEED进行聚类,选出速度明显较低的路段作为速度异常路段;步骤3.2、根据速度异常段的首节点LNODE和尾节点NNODE,满足下列条件之一,则将速度异常路段所在城市判断为中间节点:条件一、若速度异常路段的首节点LNODE和尾节点NNODE在同一城市,则标记该城市为中间节点;条件二、若速度异常路段的首节点LNODE和尾节点NNODE不在同一城市内,则依据速度异常路段在首节点LNODE和尾节点NNODE城市的长度,取距离长者对应的城市作为中间节点;若速度异常路段横跨多地,其首节点LNODE和尾节点NNODE在空间上不邻接,则无法判别其中哪一个节点为中间节点,放弃标注或抛弃当前的单次出行时间序列;步骤3.3、将单次出行时间序列中除出发地‑目的地节点和中间节点外的其余节点均标记为过境点;步骤3.4、提取O‑D节点和中间节点之间路段的速度,对照各出行方式的平均速度,判别各次出行所采用的出行方式;步骤4、根据得到的大量EPID的单次出行时间序列数据,以及与其配套的出行方式与节点属性数据,分析城市间迁移客流的流量、流向,以及各城市在人流迁移过程中的功能。...

【技术特征摘要】
1.一种基于手机大数据的城市间迁移客流分析方法,其特征在于,包括以下步骤:步骤1、从通信运营商获取不同城市的在时间与空间上连续的匿名加密手机数据,对每个EPID而言,依据当前EPID的匿名加密手机数据计算得到指定时间段内的各手机数据对应的真实经度坐标LON及真实纬度坐标LAT,将不同的城市定义为不同的区域LOC,根据计算得到的所有的真实经度坐标LON及真实纬度坐标LAT,获得当前EPID在指定时间段内所处的区域LOC的个数,剔除区域LOC的个数不大于1个的所有EPID,则得到在指定时间段内所有跨城市的EPID,并将这些跨城市的EPID记录入目标数据库;步骤2、根据目标数据库中每个EPID在指定时间段内的全部通信记录,以区域LOC为空间划分单位,将当前EPID在每个区域LOC内的通信活动发生的时间进行排序,形成当前EPID在每个区域LOC内通信行为的时间轴;在此基础上,通过时间轴每一条记录中的真实经度坐标LON及真实纬度坐标LAT,进行地理映射,根据其经纬度坐标投射到地理空间,生成时空数据;利用地理邻接网络对时空数据进行空间连续性检验;计算时空数据中每一时间段的时长与该段路径理论上的长度,以此计算用户在该段的行进速度,获得用户出行时空序列组,包括以下步骤步骤2.1、遍历已存入目标数据库的满足跨城市出行条件的EPID,在目标数据库中查找指定时间段内当前EPID的所有记录,将每条记录中的相应信息与地理数据进行匹配,将每条记录作为一个数据点落到实际地图中,每个数据点至少包括:EPID、记录发生时间TIME、真实经度坐标LON、真实纬度坐标LAT、区域LOC;步骤2.2、以区域LOC为单位,查找当前EPID在指定时间段内段内在各个区域LOC中被记录的第一条通信记录FirstRec所对应的数据点作为一个节点和最后一条通信记录LastRec所对应的数据点作为一个节点,并根据每条通信记录的发生时间对得到的节点进行排序,构建路段数据,路段数据中的字段至少包括:路段始节点LNODE、路段终节点NNODE、经过该路段花费的时间TIME,路段数据和节点数据共同形成全时空序列数据;步骤2.3、遍历全时空序列数据,标记其中的出发地-目的地节点;步骤2.4、将当前EPID的全时空序列数据根据出发地-目的地节点进行裁剪,形成多条仅有首尾节点是出发地-目的地节点的单次出行时间序列;步骤2.5、结合城际铁路网和三级公路网数据或城市间邻接矩阵提取出路段数据的直线距离、公路距离和铁路距离,即为路径长度DISTANCE;步骤2.6、利用路径长度DISTANCE和时间TIME,计算得到每个路段的进行速度SPEED,并将进行速度SPEED加入单次出行时间序列中,当步骤2.5中使用的是城际铁路网和三级公路网数据时,获得三种速度:直线速度SPEED-S、高铁速度SPEED-H和公路网速度SPEED-R;当步骤2.5中使用的是城市间邻接矩阵时,获得二种速度:直线速度SPEED-S、邻接矩阵速度SPEED-M;步骤3、根据当前EPID的单次出行时间序列中的进行速度SPEED判别非出发地-目的地节点的节点类型,并以此最终确定当前EPID的出行方式,包括以下步骤:步骤3.1、首先对当前EPID的单次出行时间序列上各路段的进行速度SPEED进行聚类,选出速度明显较低的路段作为速度异常路段;步骤3.2、根据速度异常段的首节点LNODE和尾节点NNODE,满足下列条件之一,则将速度异常路段所在城市判断为中间节点:条件一、若速度异常路段的首节点LNODE和尾节点NNODE在同一城市,则标记该城市为中间节点;条件二、若速度异常路段的首节点LNODE和尾节点NNODE不在同一城市内,则依据速度异常路段在首节点LNODE和尾节点NNODE城市的长度,取距离长者对应的城市作为中间节点;若速度异常路段横跨多地,其首节点LNODE和尾节点NNODE在空间上不邻接,则无法判别其中哪一个节点为中间节点,放弃标注或抛弃当前的单次出行时间序列;步骤3.3、将单次出行时间序列中除出发地-目的地节点和中间节点外的其余节点均标记为过境点;步骤3.4、提取O-D节点和中间节点之间路段的速度,对照各出行方式的平均速度,判别各次出行所采用的出行方式;步骤4、根据得到的大量EPID的单次出行时间序列数据,以及与其配套的出行方式与节点属性数据,分析城市间迁移客流的流量、流向,以及各城市在人流迁移过程中的功能。2.如权利要求1所述的一种基于手机大数据的城市间迁移客流分析方法,其特征在于,所述步骤1包括以下步骤:步骤1.1、从通信运营商实时获取匿名手机数据,匿名手机数据包括:EPID、TYPE、TIME、X、Y、SR、LOC,其中:EPID为匿名单向加密全球唯一移动用户标识码,是通信运营商对每个用户进行单向不可逆加密,从而唯一标识每个用户,且不暴露用户号码隐私信息;TYPE为当前匿名手机数据所涉及的网络动作类型;TIME为当前匿名手机数据所涉及的网络动作的发生时刻;X、Y为利用专用坐标加密方法对手机用户的真实坐标位置进行加密计算后得到加密坐标;SR为空间范围,是当前匿...

【专利技术属性】
技术研发人员:顾高翔刘杰张颖吴佳玲
申请(专利权)人:上海华企软件有限公司
类型:发明
国别省市:上海;31

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1