【技术实现步骤摘要】
一种利用核函数处理手机信令数据识别就业地的方法
本专利技术涉及城市就业地研究领域,具体涉及一种利用核函数处理手机信令数据识别就业地的方法。
技术介绍
就业地是城市居民参与生产活动而构成的固定空间范围——时间上,在就业地参与生产活动的时间具有规律性,通常呈现白天人多,晚上人少的特征;地点固定性,是居民参与生产活动频繁使用的空间。因此,根据上述特征,本研究探讨的就业地是指城市居民参与生产活动的地理位置。传统的就业地识别思路主要依赖于用户白天数据的规律性,即通过用户白天在一个周期内不同时间节点出现在同一基站的次数累加起来判断是否为就业地,有一定的可操作性和合理性。但是,上述识别方法的最大问题在于:识别时间主要依赖单时段(白天)用户的基站移动情况,而很可能将上夜班、甚至两班倒和三班倒(如医院和工厂等特定的企事业单元)的实际就业地忽略,甚是误判为用户居住地。本专利技术一种利用核函数处理手机信令数据识别就业地的方法。
技术实现思路
针对现有技术的不足,本专利技术提出了一种利用核函数处理手机信令数据识别
【技术保护点】
1.一种利用核函数处理手机信令数据识别就业地的方法,其特征在于,包括:/n根据区域内目标基站的经纬度信息数据生成泰森多边形,并以泰森多边形作为待识别单元;/n根据区域内的法定工作日手机信令数据进行清洗并统计所有用户进入和离开所述待识别单元行为发生的时间点;/n将所述时间点通过核函数估计生成所述待识别单元的的进入和离开核函数估计图像,根据所述核函数估计图像获得进出曲线;/n对所述进出曲线进行道格拉斯曲线精简,筛选出进出曲线的进入波峰和离开波峰;根据所述进入波峰和离开波峰确定所述进出曲线的类型;/n依次根据所述进出曲线的类型、所述进入波峰时间间隔、所述离开波峰时间间隔、所述进入 ...
【技术特征摘要】
1.一种利用核函数处理手机信令数据识别就业地的方法,其特征在于,包括:
根据区域内目标基站的经纬度信息数据生成泰森多边形,并以泰森多边形作为待识别单元;
根据区域内的法定工作日手机信令数据进行清洗并统计所有用户进入和离开所述待识别单元行为发生的时间点;
将所述时间点通过核函数估计生成所述待识别单元的的进入和离开核函数估计图像,根据所述核函数估计图像获得进出曲线;
对所述进出曲线进行道格拉斯曲线精简,筛选出进出曲线的进入波峰和离开波峰;根据所述进入波峰和离开波峰确定所述进出曲线的类型;
依次根据所述进出曲线的类型、所述进入波峰时间间隔、所述离开波峰时间间隔、所述进入波峰的频次和所述离开波峰的频次判断所述待识别单元是否为就业地及类型。
2.根据权利要求1所述的识别就业地的方法,其特征在于,所述进出曲线若满足离开波峰在最接近的进入波峰1小时内出现,则判定所述进出曲线的类型为同期异向型;若不满足,则判定所述进出曲线的类型为异期异向型。
3.根据权利要求3所述的识别就业地的方法,其特征在于,所述待识别单元若满足所述进出曲线为异期异向型,所述进入波峰的频次≤2,所述离开波峰的频次≤2,8h≤所述进入波峰的间隔≤12h,8h≤所述离开波峰的间隔≤12h,则判定所述待识别单元为不倒班的一班就业地;
若满足所述进出曲线为同期异向型,所述进入波峰的频次=2,所述离开波峰的频次=2,11h≤所述进入波峰的间隔≤12h,11h≤所述离开波峰的间隔≤12h,则判定所述待识别单元为两班倒就业地;
若满足所述进出曲线为同期异向型,所述进入波峰的频次≥3,所述离开波峰的频次≥3,至少有两个所述进入波峰的间隔>7h、至少有两个所述离开波峰的间隔>7h,则判定所述基站为三班倒就业地;
以上条件均不满足,则判断所述待识别单元为非就业地。
4.根据权利要求2所述的识别就业地...
【专利技术属性】
技术研发人员:吴晓,何彦,张瑞琪,邵云通,张小国,
申请(专利权)人:东南大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。