基于手机信令的人口居住地迁徙识别方法技术

技术编号:22471655 阅读:63 留言:0更新日期:2019-11-06 13:06
本发明专利技术公开了一种基于手机信令的人口居住地迁徙识别方法,该识别方法通过利用手机信令数据作为基础对用户的居住地的迁徙进行识别,具有用户基数大、覆盖人群广、数据动态连续等特点;并且,通过连续跟踪监测用户多月居住地位置,将用户每月的居住空间位置转换成一组具有时序特征的空间位置,然后通过建立时序空间数据聚类模型,自动识别居住地发生迁徙的人群,记录迁徙发生的时间、迁入/迁出位置等信息,实现动态掌握人口居住地迁徙规律。该识别方法让人口居住地的迁徙不受统计时间的约束,时效性强,可连续观测,便于研究变化趋势,可以研究一年内居住地发生迁徙的人口,也可以研究三年内发生变化的人口。

Mobile phone signaling based migration identification method of population residence

【技术实现步骤摘要】
基于手机信令的人口居住地迁徙识别方法
本专利技术涉及一种基于手机信令的人口居住地迁徙识别方法。
技术介绍
人口迁移一般指的是人口在两个地区之间的空间移动,这种移动通常涉及人口居住地由迁出地到迁入地的永久性或长期性的改变。人口迁徙研究是城市规划十分重要的基础性工作,无论是改革前的城市总体规划还是改革后的国土空间总体规划,城市用地、公共设施等指标都是根据人口活动规律制定的。人口迁徙的规模在一定程度上反映了一个城市的地位,迁徙的方向反映城市的辐射范围与城市发展的腹地,区域间的社会文化背景等。目前掌握城市人口迁徙规律主要通过问卷调查和普查数据两种方式展开。这两种方式都是通过人工手段设置调查问卷,根据一定的抽样比例随机的选择目标群体开展调查。根据汇总结果进行扩样计算,最终得到城市人口迁徙规律。
技术实现思路
本专利技术的目的是提供一种基于手机信令的人口居住地迁徙识别方法,以解决现有目前问卷调查等人工手段需要耗费巨大的人力和财力成本,很难实现大样本、大范围的调查的问题。为解决上述技术问题,本专利技术提供一种基于手机信令的人口居住地迁徙识别方法,包括以下步骤:S1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;S2:对所述数据源做领域分析,构建包括用户停留点Pj以及所有停留点Pj的邻域集合{Pi}的停留点关系模型;S3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;S4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的居住地hi(x,y)进行标记;S5:将所有用户每月的居住地hi(x,y)存储到居住地集合{H},利用时空聚类算法将所述用户的居住地集合{H}按照时序进行聚类分组;S6:根据所述聚类分组结果建立时序空间数据聚类模型,并根据所述时序空间数据聚类模型识别居住地发生迁徙的人群。进一步地,所述用户停留点Pj包括用户编号、停留点编号、停留点位置、停留点起止时间。进一步地,步骤S3具体包括以下步骤:S31:遍历留点关系模型中的停留点Pj和邻域集合{Pi},使邻域集合{Pi}按照其包含的停留点Pj个数的降序进行排列,并将邻域集按照排列顺序依次标记为活动点Aj,同时将活动点Aj位置标记为停留点Pj位置,并记录停留点Pj的邻域集合{Pi};S32:清除停留点关系模型中的包含停留点个数最多的邻域集合{Pi}中的所有停留点Pj;S33:重复步骤S31和S32,直至遍历完当前用户的所有核心对象,得到{Aj}组合即为活动点分组。进一步地,根据聚类分组结果建立用户活动的活动规律指标所采用的方法具体包括:遍历每位用户当月的所有的活动点Aj,计算每个活动点分组{Aj}中邻域集合{Pi}与全月每天的白天时段、夜间时段和全日时段的交集时长作为活动点Aj在当日的白天停留时长、夜间停留时长和全日停留时长;若停留时长大于等于预设阈值,则对应的时段累加天数计数加1。进一步地,根据所述活动规律指标对用户的活动规律进行标记所采用的具体方法包括:若用户的某一活动点较该用户当月其它所有活动点全日停留时长最大且夜间停留时长最大,同时全日停留时长大于等于当月实际天数的60%,则标记该活动点为居住地hi(x,y)。进一步地,所述步骤S5具体包括:S51:将所有用户每月的居住地hi(x,y)存储到居住地集合{H},依次遍历所有用户的居住地集合{H},同一用户按照时间先后顺序遍历,依次加入待合并组;S52:当出现新插入位置hj时,使新插入位置hj与待合并居住地集合{H}中的所有空间位置做相似性计算,相似度计算公式具体为:Sim(H,hj)=1/(1+d(H,hj));S53:判断Sim(H,hj)是否小于0.5;若是,则停止合并,并将待合并居住地集合{H}标识为一组具有高相似度的居住地集合{Hi},并清空待合并组;若否,则将新插入位置hj加入居住地集合{Hi};S54:重复步骤S52和S53,直至识别完成所有新插入位置hj。进一步地,所述步骤S6具体包括:根据分析需求动态确定迁徙研究目标时长TL,根据迁徙研究目标时长TL筛选出这个时期中每个用户的居住地集合{Hi},若居住地集合{Hi}的次数大于1则标记该用户发生迁移。本专利技术的有益效果为:本申请通过利用手机信令数据作为基础对用户的居住地的迁徙进行识别,具有用户基数大、覆盖人群广、数据动态连续等特点;并且,通过连续跟踪监测用户多月居住地位置,将用户每月的居住空间位置转换成一组具有时序特征的空间位置,然后通过建立时序空间数据聚类模型,自动识别居住地发生迁徙的人群,记录迁徙发生的时间、迁入/迁出位置等信息,实现动态掌握人口居住地迁徙规律。该识别方法让人口居住地的迁徙不受统计时间的约束,时效性强,可连续观测,便于研究变化趋势,可以研究一年内居住地发生迁徙的人口,也可以研究三年内发生变化的人口;另外,打破行政边界研究可以指定任意空间单元,最小可以监测任意一个手机基站附近人口居住地的变化,提高人口迁徙识别的效率和准确度。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本专利技术一个实施例的流程图。具体实施方式一种基于手机信令的人口居住地迁徙识别方法,该方法具体包括以下步骤:S1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;其中,所述用户停留点Pj包括用户编号、停留点编号、停留点位置、停留点起止时间。S2:对所述数据源做领域分析,构建包括用户停留点Pj以及所有停留点Pj的邻域集合{Pi}的停留点关系模型;S3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;S4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的居住地hi(x,y)进行标记;S5:将所有用户每月的居住地hi(x,y)存储到居住地集合{H},利用时空聚类算法将所述用户的居住地集合{H}按照时序进行聚类分组;S6:根据所述聚类分组结果建立时序空间数据聚类模型,并根据所述时序空间数据聚类模型识别居住地发生迁徙的人群。根据本申请的一个实施例,上述步骤S3具体包括以下步骤:S31:遍历留点关系模型中的停留点Pj和邻域集合{Pi},使邻域集合{Pi}按照其包含的停留点Pj个数的降序进行排列,并将邻域集按照排列顺序依次标记为活动点Aj,同时将活动点Aj位置标记为停留点Pj位置,并记录停留点Pj的邻域集合{Pi};S32:清除停留点关系模型中的包含停留点个数最多的邻域集合{Pi}中的所有停留点Pj;S33:重复步骤S31和S32,直至遍历完当前用户的所有核心对象,得到{Aj}组合即为活动点分组。根据本申请的一个实施例,根据聚类分组结果建立用户活动的活动规律指标所采用的方法具体包括:遍历每位用户当月的所有的活动点Aj,计算每个活动点分组{Aj}中邻域集合{Pi}与全月每天的白天时段、夜间时段和全日时段的交集时长作为活动点Aj在当日的白天停留时长(09:00-17:00)、夜间停留时长(20:00–06:00)和全日停留本文档来自技高网...

【技术保护点】
1.一种基于手机信令的人口居住地迁徙识别方法,其特征在于,包括以下步骤:S1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;S2:对所述数据源做领域分析,构建包括用户停留点Pj以及所有停留点Pj的邻域集合{Pi}的停留点关系模型;S3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;S4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的居住地hi(x,y)进行标记;S5:将所有用户每月的居住地hi(x,y)存储到居住地集合{H},利用时空聚类算法将所述用户的居住地集合{H}按照时序进行聚类分组;S6:根据所述聚类分组结果建立时序空间数据聚类模型,并根据所述时序空间数据聚类模型识别居住地发生迁徙的人群。

【技术特征摘要】
1.一种基于手机信令的人口居住地迁徙识别方法,其特征在于,包括以下步骤:S1:根据手机信令数据获取用户停留点信息,并将所述停留点信息按照用户唯一标识进行分组作为用户活动空间识别的数据源;S2:对所述数据源做领域分析,构建包括用户停留点Pj以及所有停留点Pj的邻域集合{Pi}的停留点关系模型;S3:利用时空聚类算法根据所述停留点关系模型计算用户活动进行聚类分组;S4:根据聚类分组结果建立用户活动的活动规律指标,根据所述活动规律指标对用户的居住地hi(x,y)进行标记;S5:将所有用户每月的居住地hi(x,y)存储到居住地集合{H},利用时空聚类算法将所述用户的居住地集合{H}按照时序进行聚类分组;S6:根据所述聚类分组结果建立时序空间数据聚类模型,并根据所述时序空间数据聚类模型识别居住地发生迁徙的人群。2.根据权利要求1所述的基于手机信令的人口居住地迁徙识别方法,其特征在于,所述用户停留点Pj包括用户编号、停留点编号、停留点位置、停留点起止时间。3.根据权利要求1或2所述的基于手机信令的人口居住地迁徙识别方法,其特征在于,步骤S3具体包括以下步骤:S31:遍历留点关系模型中的停留点Pj和邻域集合{Pi},使邻域集合{Pi}按照其包含的停留点Pj个数的降序进行排列,并将邻域集按照排列顺序依次标记为活动点Aj,同时将活动点Aj位置标记为停留点Pj位置,并记录停留点Pj的邻域集合{Pi};S32:清除停留点关系模型中的包含停留点个数最多的邻域集合{Pi}中的所有停留点Pj;S33:重复步骤S31和S32,直至遍历完当前用户的所有核心对象,得到{Aj}组合即为活动点分组。4.根据权利要求1所述的基于手机信令的人口居住地迁徙识别方法,其特征在于,根据聚类分组结果建立用户活动的活动规律指标所采用的方...

【专利技术属性】
技术研发人员:赵必成唐小勇高志刚张建嵩
申请(专利权)人:重庆市交通规划研究院
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1