一种二维手机信令数据转化三维空间轨迹数据的方法技术

技术编号:26386467 阅读:34 留言:0更新日期:2020-11-19 23:55
本发明专利技术公开一种二维手机信令数据转化三维空间轨迹数据的方法,包括以下步骤:将原始信令数据表和基站‑扇区经纬度静态数据表进行连接、筛选研究选定城市区域经纬度范围内的所有原始手机信令数据、进行缺失数据处理、进行错误异常数据处理、进行重复数据处理、进行乒乓数据处理、进行漂移数据处理、进行伪漂移数据处理和进行数据清洗后的基站坐标修正。通过对异常数据进行预清洗,在此基础上有效准确地识别并修正伪漂移数据来避免原始数据集的过度损失,最后基于城市路网数据对清洗后的手机信令数据进行坐标修正,从而减少信令数据在空间上的定位偏差,提高交通时空大数据分析挖掘的准确性。

【技术实现步骤摘要】
一种二维手机信令数据转化三维空间轨迹数据的方法
本专利技术属于城市交通大数据挖掘领域,涉及一种二维手机信令数据的预处理方法,具体的说是一种二维手机信令数据转化为三维空间轨迹数据的方法。
技术介绍
城市居民在使用手机进行通信或切换基站时,都会出发基站从而产生信令数据,由此得到居民所被辐射的基站的经纬度坐标。相比传统的城市交通出行调查和GPS定位数据,手机信令数据具有低成本(不需要发射卫星)、大样本且覆盖范围广(通过搭建基站即可生成并记录信令数据)、安全性高(数据为脱敏数据,不含有任何个人属性信息,不侵犯用户隐私)、跟随性强(定位数据由基站位置决定,不受居民的出行方式影响)等优点。根据截至2019年6月的调查数据显示,我国手机网民规模达8.47亿,比例高达99.1%。因此只要携带手机出行的居民都会产生一定量的手机信令数据,所以该种数据的用户持有率较高。然而手机信令数据仍存两个明显缺陷:(1)在原始手机信令数据中仍存在较多脏数据,主要有缺失数据、错误数据、重复数据、乒乓数据、漂移数据、伪漂移数据、静止冗余数据等误差数据。其中缺本文档来自技高网...

【技术保护点】
1.一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于,包括以下步骤:/nS1:将原始手机信令数据表和基站-扇区经纬度静态数据表进行连接;/nS2:筛选研究选定城市区域经纬度范围内的所有原始手机信令数据;/nS3:进行缺失数据处理;/nS4:进行错误异常数据处理;/nS5:进行重复数据处理;/nS6:进行乒乓数据处理;/nS7:进行漂移数据处理;/nS8:进行伪漂移数据处理;/nS9:进行数据清洗后的基站坐标修正;/n其中,所述的原始手机信令数据包括的字段名称和含义包括如下:/n1)timestamp:信息记录开始时间;/n2)imsi:用户唯一id;/n3)lac_id:基站位置区编...

【技术特征摘要】
1.一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于,包括以下步骤:
S1:将原始手机信令数据表和基站-扇区经纬度静态数据表进行连接;
S2:筛选研究选定城市区域经纬度范围内的所有原始手机信令数据;
S3:进行缺失数据处理;
S4:进行错误异常数据处理;
S5:进行重复数据处理;
S6:进行乒乓数据处理;
S7:进行漂移数据处理;
S8:进行伪漂移数据处理;
S9:进行数据清洗后的基站坐标修正;
其中,所述的原始手机信令数据包括的字段名称和含义包括如下:
1)timestamp:信息记录开始时间;
2)imsi:用户唯一id;
3)lac_id:基站位置区编码;
4)cell-id:扇区编号;
所述的基站-扇区经纬度静态数据包括的字段名称和含义如下所示:
1)longitude:经度;
2)latitude:纬度;
3)laci:基站信息;其中原始手机信令数据中的lac_id、cell_id与基站-扇区经纬度静态数据中的laci关联可获取信令数据中出行者触发的基站经纬度信息。


2.根据权利要求1所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S1的具体过程是:
a)将基站-扇区经纬度静态数据表中的laci字段拆分成如下所示的四种字段:
(基站编号base_num,扇区编号section_num,扇区经度sec_long,扇区纬度sec_lat);
b)其中,使(基站编号base_num,扇区编号section_num)与原始手机信令数据表中的lac_id与cell_id字段进行连接;
c)最终得到原始信令数据中每条数据所触发基站的经纬度。


3.根据权利要求2所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S2中研究城市区域被假定为矩形区域,其经纬度的最大值与最小值分别为:longmax、longmin、latimax、latimin,则在S2步骤中筛选有效数据的依据为每条信令数据记录的基站经纬度(longsignal,latisignal)必须满足:
longmin≤longsignal≤longmax
latimin≤latisignal≤latimax。


4.根据权利要求3所述一种二维手机信令数据转化三维空间轨迹数据的方法,其特征在于:所述步骤S3中,缺失数据所缺失的关键字段主要包括用户id(imsi)、记录时间(timestamp)、基站和扇区的编号(lac_id和cell_id),将原始数据中含有缺...

【专利技术属性】
技术研发人员:陈润桓戴华史可为杨茂虎周倩杨庚黄海平
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1