当前位置: 首页 > 专利查询>东南大学专利>正文

一种利用核函数处理手机信令数据识别就业地的方法技术

技术编号:28633612 阅读:38 留言:0更新日期:2021-05-28 16:31
本发明专利技术公开了一种利用核函数处理手机信令数据识别就业地的方法,属于城市就业地研究领域。本发明专利技术以手机基站形成的泰森多边形作为待识别单元;对任一待识别单元任一工作日内的进出活动发生时间点进行数据统计;通过对用户每条手机信令数据记录的基站位置信息和前后记录的基站位置信息进行比较,来判断用户行为。之后统计各待识别单元的进出行为发生的时间节点,并利用核函数估计方法分析各待识别单元的进出行为发生时间节点所引发的“波峰规律”,通过波峰出现的频次和时间间隔来共同判断待识别单元是否为就业地及其类型。与现有技术相比,本发明专利技术能够便捷和准确地识别城市人口的就业地,为城市空间的有效解析和利用提供有力的技术支撑。

【技术实现步骤摘要】
一种利用核函数处理手机信令数据识别就业地的方法
本专利技术涉及城市就业地研究领域,具体涉及一种利用核函数处理手机信令数据识别就业地的方法。
技术介绍
就业地是城市居民参与生产活动而构成的固定空间范围——时间上,在就业地参与生产活动的时间具有规律性,通常呈现白天人多,晚上人少的特征;地点固定性,是居民参与生产活动频繁使用的空间。因此,根据上述特征,本研究探讨的就业地是指城市居民参与生产活动的地理位置。传统的就业地识别思路主要依赖于用户白天数据的规律性,即通过用户白天在一个周期内不同时间节点出现在同一基站的次数累加起来判断是否为就业地,有一定的可操作性和合理性。但是,上述识别方法的最大问题在于:识别时间主要依赖单时段(白天)用户的基站移动情况,而很可能将上夜班、甚至两班倒和三班倒(如医院和工厂等特定的企事业单元)的实际就业地忽略,甚是误判为用户居住地。本专利技术一种利用核函数处理手机信令数据识别就业地的方法。
技术实现思路
针对现有技术的不足,本专利技术提出了一种利用核函数处理手机信令数据识别就业地的方法。本专利技术的目的可以通过以下技术方案实现:一种利用核函数处理手机信令数据识别就业地的方法,包括:根据区域内目标基站的经纬度信息数据生成泰森多边形,并以泰森多边形作为待识别单元;根据区域内的法定工作日手机信令数据进行清洗并统计所有用户进入和离开所述待识别单元行为发生的时间点;将所述时间点通过核函数估计生成所述待识别单元的的进入和离开核函数估计图像,根据所述核函数估计图像获得进出曲线;对所述进出曲线进行道格拉斯曲线精简,筛选出进出曲线的进入波峰和离开波峰;根据所述进入波峰和离开波峰确定所述进出曲线的类型;依次根据所述进出曲线的类型、所述进入波峰时间间隔、所述离开波峰时间间隔、所述进入波峰的频次和所述离开波峰的频次判断所述待识别单元是否为就业地及类型。进一步地,所述进出曲线若满足离开波峰在最接近的进入波峰1小时内出现,则判定所述进出曲线的类型为同期异向型;若不满足,则判定所述进出曲线的类型为异期异向型。进一步地,所述待识别单元若满足所述进出曲线为异期异向型,所述进入波峰的频次≤2,所述离开波峰的频次≤2,8h≤所述进入波峰的间隔≤12h,8h≤所述离开波峰的间隔≤12h,则判定所述待识别单元为不倒班的一班就业地;若满足所述进出曲线为同期异向型,所述进入波峰的频次=2,所述离开波峰的频次=2,11h≤所述进入波峰的间隔≤12h,11h≤所述离开波峰的间隔≤12h,则判定所述待识别单元为两班倒就业地;若满足所述进出曲线为同期异向型,所述进入波峰的频次≥3,所述离开波峰的频次≥3,至少有两个所述进入波峰的间隔>7h、至少有两个所述离开波峰的间隔>7h,则判定所述基站为三班倒就业地;以上条件均不满足,则判断所述待识别单元为非就业地。进一步地,满足所述进出曲线为异期异向型时,筛除所述进出曲线中11:00-13:00之间的波峰,11:00-13:00这个时间段在异期异向型中基本上是午休时间,人员进出会出现小高峰现象,对继续判断就业地的类型会造成干扰,筛除后能提高判定准确性和效率。进一步地,所述进出曲线根据道格拉斯曲线精简算法筛除小于或等于所述待识别单元进入核函数估计的函数平均值的进入波峰以及小于或等于所述待识别单元离开核函数估计的核函数平均值的离开波峰。小于平均值的波峰不是人员上下班的高峰,筛除后能进一步提高判定效率和准确性。进一步地,所述核函数估计的带宽设置为1小时,带宽设置为1小时在不影响判定结果的情况下,提升了判定速度。进一步地,所述根据区域内的法定工作日手机信令数据进行清洗并统计所有用户进入和离开所述待识别单元行为发生的时间点,包含以下步骤:根据所述手机信令数据获取用户任意一条记录中的所述目标基站位置信息;根据所述记录的目标基站位置信息、所述记录的前一条记录和后一条记录中的基站位置信息,判断所述记录对应的时间点类型;满足所述前一条位置信息存在且与所述目标基站位置信息不同,则判定所述记录对应的时间点为进入所述待识别单元的时间点;满足所述后一条位置信息存在且与所述目标基站位置信息不同,则判定所述记录对应的时间点为离开所述待识别单元的时间点;满足所述后一条位置信息和所述前一条位置信息均不存在,或者所述后一条位置信息和所述前一条位置信息均与所述目标基站位置信息相同,则判定所述记录对应的时间点为无行动的时间点。上述过程能够精准的判断每个时间点的用户行为,为判定目标基站的进出曲线的绘制提供精准的数据,从而提高就业地的判定的准确性。进一步地,获取所述目标基站的用地性质,所述目标基站的用地性质为E类或G类用地,直接判定所述目标基站为非就业地。E类用地属于水域或者其他用地,G类用地属于绿地与广场用地,此两类用地明显不属于就业地,可以直接排出。一种计算机可读存储介质,存储有计算机程序,执行所述计算机程序时实现上述方法。一种城市布局研究终端,包括上述的存储介质。本专利技术的有益效果:本专利技术提供一种利用核函数处理手机信令数据识别就业地的方法,能精确的辨识某个区域是否为就业地。以某个基站生成的泰森多边形为识别区域,统计进入和离开待识别单元行为发生的时间节点,通过核函数估计描摹进入、离开行为发生时间节点的波峰,并比较波峰出现的频次和间隔以判断该基站是否为就业地,并确定该就业地类型。本专利技术能够便捷和准确地识别城市人口的就业地,为城市空间的布局提供有力的技术支撑。附图说明下面结合附图对本专利技术作进一步的说明。图1为本申请的方法流程示意图;图2为本申请的本专利技术应用于某市区街道示意图;图3为本申请的街道内基站示意图;图4为本申请的街道内基站生成泰森多边形作为待识别单元示意图;图5为本申请的待识别单元识别结果示意图;图6为本申请的典型待识别单元判断结果及其核函数估计示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。在本专利技术的描述中,需要理解的是,术语“开孔”、“上”、“下”、“厚度”、“顶”、“中”、“长度”、“内”、“四周”等指示方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的组件或元件必须具有特定的方位,以特定的方位构造和操作,因此不能理解为对本专利技术的限制。在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本专利技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描本文档来自技高网...

【技术保护点】
1.一种利用核函数处理手机信令数据识别就业地的方法,其特征在于,包括:/n根据区域内目标基站的经纬度信息数据生成泰森多边形,并以泰森多边形作为待识别单元;/n根据区域内的法定工作日手机信令数据进行清洗并统计所有用户进入和离开所述待识别单元行为发生的时间点;/n将所述时间点通过核函数估计生成所述待识别单元的的进入和离开核函数估计图像,根据所述核函数估计图像获得进出曲线;/n对所述进出曲线进行道格拉斯曲线精简,筛选出进出曲线的进入波峰和离开波峰;根据所述进入波峰和离开波峰确定所述进出曲线的类型;/n依次根据所述进出曲线的类型、所述进入波峰时间间隔、所述离开波峰时间间隔、所述进入波峰的频次和所述离开波峰的频次判断所述待识别单元是否为就业地及类型。/n

【技术特征摘要】
1.一种利用核函数处理手机信令数据识别就业地的方法,其特征在于,包括:
根据区域内目标基站的经纬度信息数据生成泰森多边形,并以泰森多边形作为待识别单元;
根据区域内的法定工作日手机信令数据进行清洗并统计所有用户进入和离开所述待识别单元行为发生的时间点;
将所述时间点通过核函数估计生成所述待识别单元的的进入和离开核函数估计图像,根据所述核函数估计图像获得进出曲线;
对所述进出曲线进行道格拉斯曲线精简,筛选出进出曲线的进入波峰和离开波峰;根据所述进入波峰和离开波峰确定所述进出曲线的类型;
依次根据所述进出曲线的类型、所述进入波峰时间间隔、所述离开波峰时间间隔、所述进入波峰的频次和所述离开波峰的频次判断所述待识别单元是否为就业地及类型。


2.根据权利要求1所述的识别就业地的方法,其特征在于,所述进出曲线若满足离开波峰在最接近的进入波峰1小时内出现,则判定所述进出曲线的类型为同期异向型;若不满足,则判定所述进出曲线的类型为异期异向型。


3.根据权利要求3所述的识别就业地的方法,其特征在于,所述待识别单元若满足所述进出曲线为异期异向型,所述进入波峰的频次≤2,所述离开波峰的频次≤2,8h≤所述进入波峰的间隔≤12h,8h≤所述离开波峰的间隔≤12h,则判定所述待识别单元为不倒班的一班就业地;
若满足所述进出曲线为同期异向型,所述进入波峰的频次=2,所述离开波峰的频次=2,11h≤所述进入波峰的间隔≤12h,11h≤所述离开波峰的间隔≤12h,则判定所述待识别单元为两班倒就业地;
若满足所述进出曲线为同期异向型,所述进入波峰的频次≥3,所述离开波峰的频次≥3,至少有两个所述进入波峰的间隔>7h、至少有两个所述离开波峰的间隔>7h,则判定所述基站为三班倒就业地;
以上条件均不满足,则判断所述待识别单元为非就业地。


4.根据权利要求2所述的识别就业地...

【专利技术属性】
技术研发人员:吴晓何彦张瑞琪邵云通张小国
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1