【技术实现步骤摘要】
数据处理方法及装置
[0001]本申请涉及大数据分析领域,尤其涉及一种数据处理方法及装置。
技术介绍
[0002]手机的信令数据直接来源于运营商的移动通信系统。当手机发生打电话、收发短信、挂机、位置更新、基站切换或者连接互联网等行为时,就会产生信令数据。典型的信令数据通常包括手机的标识信息,例如用户识别卡(subscriber identity module,SIM)信息、时间戳信息(包括信令数据产生的起始时间和结束时间)以及手机在对应时间戳内的位置信息等,其中,信令数据中为手机记录的位置信息通常是手机的服务基站的位置信息。
[0003]由于手机的信令数据具有覆盖范围广、实名和实施成本低等优势,因此,在城市规划或者交通规划与管理等规划工作中,通过对大量的信令数据进行分析以确定手机的停留点对于宏观掌握和把控任意时间段内用户的流动动向具有不可替代的重要性。停留点可以理解为手机停留的位置和/或在该位置停留的时长。
[0004]但是,手机在与当前服务基站通信过程中,会出现基站的非常规跳转,例如随时跳转至其他基站,然后 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取第一信令数据集,所述第一信令数据集包括终端的N1个第一信令数据,所述N1个第一信令数据中每个第一信令数据包括第一时间戳和第一位置信息,所述第一位置信息指示所述终端在所述第一时间戳指示的时长内的第一位置,N1为正整数;获取所述第一信令数据集中的N2个第一信令数据对应的第一目标信令数据,所述N2个第一信令数据至少满足如下条件:所述N2个第一信令数据中第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,所述N2个第一信令数据中任意两个第一信令数据的第一位置信息相同,i为整数,且i从1取至N1
‑
1,所述第一目标信令数据包括第一目标时间戳和第一目标位置信息,所述第一目标时间戳的起始时间为所述N2个第一信令数据第一个第一信令数据的起始时间,所述第一目标时间戳的结束时间为所述N2个第一信令数据最后一个第一信令数据的结束时间,所述第一目标位置信息与所述N2个第一信令数据中任意一个第一信令数据的第一位置信息相同,N2为小于或等于N1的正整数;根据所述第一信令数据集和所述第一目标信令数据获取第二信令数据集,所述第二信令数据集包括所述第一目标信令数据和所述第一信令数据集中除N3个第一信令数据之外的其他第一信令数据,所述N3个第一信令数据包括所述第一信令数据集按照时间戳先后顺序排列时位于所述第一个第一信令数据和所述最后一个第一信令数据之间的所有第一信令数据,N3为大于或等于N2的正整数;根据所述第二信令数据集确定所述终端的停留点。2.根据权利要求1所述的方法,其特征在于,所述获取所述第一信令数据集中的N2个第一信令数据对应的第一目标信令数据,包括:从所述第一信令数据集中获取所述N2个第一信令数据;从所述N2个第一信令数据中的第一个第一信令数据开始,执行如下处理以得到第一目标信令数据:若所述第i个第一信令数据中的第一时间戳的结束时间与第i+1个第一信令数据中的第一时间戳的起始时间之间的差值小于第一预设值,更新所述第i个第一信令数据中的第一时间戳的结束时间为所述第i+1个第一信令数据中的第一时间戳的结束时间,并删除所述第i+1个第一信令数据继续执行,直至执行到所述N2个第一信令数据中的最后一个第一信令数据;相应地,根据所述第一信令数据集和所述第一目标信令数据获取第二信令数据集,包括:获取所述N3个第一信令数据;从所述第一信令数据集中删除所述N3个第一信令数据,获得除所述N3个第一信令数据之外的其他第一信令数据;将除所述N3个第一信令数据之外的其他第一信令数据和所述第一目标信令数据组成所述第二信令数据集。3.根据权利要求2所述的方法,其特征在于,在所述获取第一信令数据集之前,所述方法还包括:获取终端的M个第二信令数据,所述M个第二信令数据中每个第二信令数据包括所述第一时间戳和第二位置信息,所述第二位置信息指示所述终端在所述第一时间戳指示的时长
内的第二位置,M为正整数;根据预设地理范围信息确定所述终端在所述每个第二信令数据中的第二位置信息所对应的中心位置,所述预设地理范围信息包括多个位置信息中每个位置信息与所述每个位置信息所属的地理范围之间的映射关系以及多个地理范围中每个地理范围与所述每个地理范围的中心位置的映射关系;根据所述M个第二信令数据确定所述N1个第一信令数据,所述N1个第一信令数据中第j个第一信令数据包括所述M个第二信令数据中第j个第二信令数据中的第一时间戳和所述第一位置信息,所述第一位置信息指示所述第j个第一信令数据中的第二位置信息所对应的中心位置,j为整数且从1取至M。4.根据权利要求3所述的方法,其特征在于,所述根据所述第二信令数据集确定所述终端的停留点,包括:获取所述第二信令数据集中的N4个信令数据对应的第二目标信令数据,所述N4个信令数据至少满足如下条件:所述N4个信令数据中任意一个信令数据中的第一位置信息与所述N4个信令数据中除所述任意一个信令数据之外的其他信令数据的第一位置信息之差小于预设的距离阈值,所述N4个信令数据在所述第一信令数据集按照时间戳先后顺序排列时处于相邻位置,所述第二目标信令数据包括第二目标时间戳和第二目标位置信息,所述第二目标时间戳的起始时间为所述N4个信令数据中对应的N4个时间戳中的起始时间的最小值,所述第二目标时间戳的结束时间为所述N4个信令数据对应的N4个时间戳中的结束时间的最大值,所述第二目标位置信息为所述N4个信令数据对应的N4个第一位置信息的加权平均值;根据所述第二信令数据集和所述第二目标信令数据获取第三信令数据集,所述第三信令数据集包括所述第二目标信令数据和所述第二信令数据集中除所述N4个信令数据之外的其他信令数据;基于所述第三信令数据集,确定所述目标用户的停留点。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述第一位置信息为经纬度信息。6.一种数据处理装置,其特征在于,包括:获取模块,用于获取第一信令数据集,所述第一信令数据集包括终端的N1个第一信令数据,所述N1个第一信令数据中每个第一信令数据包括第一时间戳和第一位置信息,所述第一位置信息指示所述终端在所述第一时间戳指示的时长...
【专利技术属性】
技术研发人员:ꢀ五一IntClH零四W六四零零,
申请(专利权)人:广州睿帆科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。