基于手机信令数据的用户出行链的构建方法和装置制造方法及图纸

技术编号:39602882 阅读:20 留言:0更新日期:2023-12-03 20:03
本公开提供了一种基于手机信令数据的用户出行链的构建方法和装置,包括获取目标用户的多个手机信令数据;对多个手机信令数据进行重复数据剔除和消除乒乓效应中的至少一种预处理操作,得到多个待使用手机信令数据;采用近似最近邻搜索算法,对多个待使用手机信令数据进行聚类,得到多个聚类簇,并确定各聚类簇对应的停留点数据;基于各停留点数据,构建目标用户的出行链

【技术实现步骤摘要】
基于手机信令数据的用户出行链的构建方法和装置


[0001]本公开涉及数据处理
,尤其涉及一种基于手机信令数据的用户出行链的构建方法和装置


技术介绍

[0002]手机信令数据是手机用户通话

发短信或移动位置等时,被通信基站捕获并记录的时间位置信息

由于手机信令数据具有覆盖面全

采集成本低等优点,因此,现有技术常通常采用手机信令数据来构建用户出行链,进而基于用户出行链进行用户出行需求评估或城市交通规划

[0003]在现有技术中,需要基于手机信令数据中记录的精确网格位置,才能构建出准确的用户出行链,但是由于运营商对于手机信令数据脱敏的要求,需要将原始手机信令数据中基站的精确位置模糊成基站所在的网格编号,这就导致数据处理方无法获取到精确的手机信令数据,进而无法构建出准确的用户出行链

因此,如何基于脱敏后的手机信令数据构建出准确的用户出行链是本领域技术人员亟待解决的技术问题


技术实现思路

[0004]有鉴于此,本公开提出了一种基于手机信令数据的用户出行链的构建方法和装置,可以基于脱敏后的手机信令数据构建出准确的用户出行链

[0005]根据本公开的第一方面,提供了一种基于手机信令数据的用户出行链的构建方法,包括:获取目标用户的多个手机信令数据,其中,所述手机信令数据包括产生所述手机信令数据的基站所属的网格的网格位置

所述目标用户进入基站所属的网格的进入时间以及离开所述网格的离开时间,且各所述手机信令数据按照所述进入时间的先后顺序进行排列;对多个所述手机信令数据进行重复数据剔除和消除乒乓效应中的至少一种预处理操作,得到多个待使用手机信令数据;采用近似最近邻搜索算法,对多个所述待使用手机信令数据进行聚类,得到多个聚类簇,并确定各所述聚类簇对应的停留点数据,其中,所述停留点数据包括停留位置

用户进入所述停留位置的时间和用户离开所述停留位置的时间;基于各所述停留点数据,构建所述目标用户的出行链

[0006]在一种可能的实现方式中,在对多个所述手机信令数据进行消除乒乓效应预处理操作时,包括:由多个所述手机信令数据中识别出相对于排序第一的第一手机信令数据的漂移点;将所述漂移点至所述第一手机信令数据之间的所有手机信令数据归并为一个新手机信令数据,以达到消除乒乓效应的目的

[0007]在一种可能的实现方式中,在由多个所述手机信令数据中识别出相对于排序第一的第一手机信令数据的漂移点时,包括:遍历多个所述手机信令数据中除所述第一手机信令数据以外的所有其它手机信令数据;针对遍历到的当前手机信令数据,计算所述当前手机信令数据中的网格位置与所述第一手机信令数据中的网格位置之间的曼哈度距离和移动速度,并基于所述曼哈度距离和所述移动速度,判断所述当前手机信令数据是否是为漂移点;遍历结束,便可以由多个所述手机信令数据中识别出相对于排序第一的第一手机信令数据的漂移点

[0008]在一种可能的实现方式中,在所述漂移点至所述第一手机信令数据之间的所有手机信令数据归并为一个新手机信令数据时,包括:将所述第一手机信令数据中的网格位置,作为所述新手机信令数据中的网格位置;将所述漂移点至所述第一手机信令数据之间的所有手机信令数据中最小的进入时间,作为所述新手机信令数据中的进入时间;将所述漂移点至所述第一手机信令数据之间的所有手机信令数据中最大的离开时间,作为所述新手机信令数据中的离开时间

[0009]在一种可能的实现方式中,在采用近似最近邻搜索算法,对多个所述待使用手机信令数据进行聚类,得到多个聚类簇时,包括:提取各所述待使用手机信令数据中的进入时间和离开时间,并基于所述进入时间和离开时间计算各所述待使用手机信数据对应的停留时间;将所述停留时间大于等于预设时间阈值的待使用手机信令数据提取出来加入至种子集合,将所述停留时间小于所述时间阈值的待使用手机信令数据提取出来加入至待聚类列表;遍历所述种子集合中的每个待使用手机信令数据;针对遍历到的当前待使用手机信令数据,采用所述近似最近邻搜索算法,对所述待聚类列表中的手机信令信号进行聚类,得到所述当前待使用手机信令数据对应的聚类簇;遍历结束,即可得到所述种子集合中每个待使用手机信令数据对应的聚类簇

[0010]在一种可能的实现方式中,在确定所述聚类簇对应的停留点数据时,包括:获取所述聚类簇的核,并基于所述聚类簇的核,确定所述聚类簇对应的停留位置;将所述聚类簇中的最小进入时间作为所述停留位置的进入时间;将所述聚类簇中的最大离开时间作为所述停留位置的离开时间;将所述停留位置

所述进入时间和所述离开时间,作为所述聚类簇对应的停留点数据

[0011]在一种可能的实现方式中,在基于各所述停留点数据,构建所述目标用户的出行链时,包括:将各所述停留点数据按照进入时间的先后顺序进行排序,并将排序后的结果作为所述目标用户的出行链

[0012]根据本公开的第二方面,提供了一种基于手机信令数据的用户出行链的构建装置,包括:数据获取模块,用于获取目标用户的多个手机信令数据,其中,所述手机信令数据包括产生所述手机信令数据的基站所属的网格的网格位置

所述目标用户进入基站所属的网格的进入时间以及离开所述网格的离开时间,且各所述手机信令数据按照所述进入时间的先后顺序进行排列;预处理模块,用于对多个所述手机信令数据进行重复数据剔除和消除乒乓效应中的至少一种预处理操作,得到多个待使用手机信令数据;停留点识别模块,用于采用近似最近邻搜索算法,对多个所述待使用手机信令数据进行聚类,得到多个聚类簇,并确定各所述聚类簇对应的停留点数据,其中,所述停留点数据包括停留位置

用户进入所述停留位置的时间和用户离开所述停留位置的时间;出行链构建模块,用于基于各所述停留点数据,构建所述目标用户的出行链

[0013]在一种可能的实现方式中,所述停留点识别模块包括停留时间计算单元

初始化单元和聚类簇生成单元;所述停留时间计算单元,用于提取各所述待使用手机信令数据中的进入时间和离开时间,并基于所述进入时间和离开时间计算各所述待使用手机信数据对应的停留时间;所述初始化单元,用于将所述停留时间大于等于预设时间阈值的待使用手机信令数据提取出来加入至种子集合,将所述停留时间小于所述时间阈值的待使用手机信令数据提取出来加入至待聚类列表;所述聚类簇生成单元,用于遍历所述种子集合中的每个待使用手机信令数据;针对遍历到的当前待使用手机信令数据,采用所述近似最近邻搜索算法,对所述待聚类列表中的手机信令信号进行聚类,得到所述当前待使用手机信令数据对应的聚类簇;遍历结束,即可得到所述种子集合中每个待使用手机信令数据对应的聚类簇

[0014]在一种可能的实现方式中,所述停留点识别模块,还包括停本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于手机信令数据的用户出行链的构建方法,其特征在于,包括:获取目标用户的多个手机信令数据,其中,所述手机信令数据包括产生所述手机信令数据的基站所属的网格位置

所述目标用户进入基站所属的网格的进入时间以及离开所述网格的离开时间,且各所述手机信令数据按照所述进入时间的先后顺序进行排列;对多个所述手机信令数据进行重复数据剔除和消除乒乓效应中的至少一种预处理操作,得到多个待使用手机信令数据;采用近似最近邻搜索算法,对多个所述待使用手机信令数据进行聚类,得到多个聚类簇,并确定各所述聚类簇对应的停留点数据,其中,所述停留点数据包括停留位置

用户进入所述停留位置的时间和用户离开所述停留位置的时间;基于各所述停留点数据,构建所述目标用户的出行链
。2.
根据权利要求1所述的方法,其特征在于,在对多个所述手机信令数据进行消除乒乓效应预处理操作时,包括:由多个所述手机信令数据中识别出相对于排序第一的第一手机信令数据的漂移点;将所述漂移点至所述第一手机信令数据之间的所有手机信令数据归并为一个新手机信令数据,以达到消除乒乓效应的目的
。3.
根据权利要求2所述的方法,其特征在于,在由多个所述手机信令数据中识别出相对于排序第一的第一手机信令数据的漂移点时,包括:遍历多个所述手机信令数据中除所述第一手机信令数据以外的所有其它手机信令数据;针对遍历到的当前手机信令数据,计算所述当前手机信令数据中的网格位置与所述第一手机信令数据中的网格位置之间的曼哈度距离和移动速度,并基于所述曼哈度距离和所述移动速度,判断所述当前手机信令数据是否是为漂移点;遍历结束,便可以由多个所述手机信令数据中识别出相对于排序第一的第一手机信令数据的漂移点
。4.
根据权利要求2所述的方法,其特征在于,在所述漂移点至所述第一手机信令数据之间的所有手机信令数据归并为一个新手机信令数据时,包括:将所述第一手机信令数据中的网格位置,作为所述新手机信令数据中的网格位置;将所述漂移点至所述第一手机信令数据之间的所有手机信令数据中最小的进入时间,作为所述新手机信令数据中的进入时间;将所述漂移点至所述第一手机信令数据之间的所有手机信令数据中最大的离开时间,作为所述新手机信令数据中的离开时间
。5.
根据权利要求1所述的方法,其特征在于,在采用近似最近邻搜索算法,对多个所述待使用手机信令数据进行聚类,得到多个聚类簇时,包括:提取各所述待使用手机信令数据中的进入时间和离开时间,并基于所述进入时间和离开时间计算各所述待使用手机信数据对应的停留时间;将所述停留时间大于等于预设时间阈值的待使用手机信令数据提取出来加入至种子集合,将所述停留时间小于所述时间阈值的待使用手机信令数据提取出来加入至待聚类列表;遍历所述种子集合中的每个待使用手机信令数据;
针对遍历到的当前待使用手机信令数据,采用所述近似最近邻搜索算法,对所述待聚类列表中的手机信令信号进行聚类,得到所述当前待使用手机信令数据对应的聚类簇;遍历结束,即可得到所述种子集合中每个待使用手...

【专利技术属性】
技术研发人员:万学进田旷王文君明玮杨安安石睿轩王炯
申请(专利权)人:北京市智慧交通发展中心北京市机动车调控管理事务中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1