一种基于信令数据的移动电话用户移动路径地图匹配方法组成比例

技术编号:25220324 阅读:52 留言:0更新日期:2020-08-11 23:10
本发明专利技术公开了一种基于信令数据的移动电话用户移动路径地图匹配方法,通过一序列的几何识别及处理,优化路径搜索空间,减少路径识别的不确定性,同时提高计算速度。在此基础上,运行最短路径搜索算法,并通过距离函数优化匹配最优解。本发明专利技术所提供的基于信令数据的移动电话用户移动路径地图匹配方法充分考虑了用户不同的日常活动模式,使用时空聚类算法将用户移动轨迹分割为子移动轨迹,再分别进行地图匹配,通过路径匹配搜索空间限定策略,减少了路径分析计算量。本发明专利技术提供了深度搜索可选功能,通过距离损失函数进行优化,寻找最优地图匹配结果。

【技术实现步骤摘要】
一种基于信令数据的移动电话用户移动路径地图匹配方法
本专利技术涉及地理信息分析及基站信令数据挖掘领域,具体涉及一种基于信令数据的移动电话用户移动路径地图匹配方法。
技术介绍
在城市区域,高密度的人口和大量的移动电话用户不断产生海量的移动网络数据,包括用户与移动电话基站交互产生的信令数据。这些数据对于揭示用户位置和移动模式具有重要的价值。同时,不涉及用户通讯内容隐私。信令数据的挖掘,对于城市交通规划可提供关键的参考和知识,也可为智慧城市建设、运行提供大数据驱动数据源。信令数据是移动电话数据的一种,是手机终端与基站间产生的除通话、短信、移动互联数据包之外交互数据,通常只包含用户标记、基站标记、开始时间、结束时间、基站信息等简单内容。目前,国内外基于信令数据的地图匹配研究主要有三种类型的方法:一是基于几何的策略,如点到点,点到线策略等;二是基于路网拓扑的方法,如基于连通性、相邻位置策略;三是基于概率的方法,如基于马尔科夫链策略。以上各策略均有相应的优点和缺点,并不能简单确定最优方法。本专利技术提出的地图匹配方法结合拓扑策略和几何策略,充分利用这两者策略的优势,从而提高地图匹配的效果。因此,我们在此开发一种基于信令数据的用户移动路径地图匹配方法。
技术实现思路
本专利技术的目的在于提供一种基于信令数据的用户移动路径地图匹配方法。为了实现上述目的,本专利技术采用了如下技术方案:本专利技术包括以下步骤:S10对信令数据进行预处理,完成异常值清理、相邻记录间移动速度计算;S20采用ST-DBSCAN算法进行时空聚类,聚类条件需设置空间半径rs及时间距离rt,最少聚类点数MinPts以产生的聚类中心作为新的轨迹点分割轨迹,按照时间构建新的时序轨迹;S30所述时序轨迹并以固定的缓冲区半径,形成范围较小的路径搜索空间,以路网拓扑为基础,对所述时序轨迹进行分段操作;S40对分段轨迹分别采用Dijkstra算法搜寻最短路径并将多个所述分段轨迹的最短路径相连形成用户移动轨迹地图匹配结果。S50以实际GPS记录数据与地图匹配结果进行对比评价匹配准确率的评估。进一步地,还包括对地图匹配进行深度搜索优化,所述深度搜索优化的步骤:继续重复步骤S10-步骤S40后,S60采用Yen’s算法计算搜寻top-k最短路径,形成k个最短路径集合。S70以轨迹点到路径的垂直距离为损失函数,优化匹配最优路径。参数k=2-5。S80以实际GPS记录数据与地图匹配结果进一步进行对比评价匹配准确率的评估。具体地,采用时空聚类算法,识别用户一段时间内的停驻位置,并以聚类中心分割移动轨迹,即S20步骤中的轨迹分割方法。进一步地,通过相邻所述基站的直线距离设置缓冲区半半径生成缓冲区裁剪搜索区域,例如平均500米有基站部署,则设定缓冲区半径为500米。相比现有技术,本专利技术的有益效果为:本专利技术所提供的基于信令数据的移动电话用户移动路径地图匹配方法充分考虑了用户不同的日常活动模式,使用时空聚类算法将用户移动轨迹分割为子移动轨迹,再分别进行地图匹配。同时,该方法设计了一种路径匹配搜索空间限定策略,减少了路径分析计算量。本专利技术提供了深度搜索可选功能,通过距离损失函数进行优化,寻找最优地图匹配结果。附图说明图1为本专利技术基于信令数据的用户移动路径地图匹配方法流程图;图2为本专利技术用户停驻点聚类及基站移动轨迹分割原理图;图3为本专利技术建立缓冲区内地图匹配原理示例;图4为本专利技术点到匹配路径距离计算方法示意图;具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。步骤S10:信令数据的收集及预处理。从信令数据中获取已下表所示字段内容。完成异常值清理、相邻记录间移动速度计算;字段含义Starttime基站产生信令数据开始时间Endtime基站产生信令数据结束时间Longitude基站经度Latitude基站纬度步骤S20:停驻点时空聚类及移动路径分割。具体地,采用时空聚类算法ST-DBSCAN,识别用户一段时间内的停驻位置,并以聚类中心分割移动轨迹。形成多段子轨迹(sub-trips)。原理如图2所示。执行算法所需的三个参数(空间搜索半径Eps1、时间距离范围Eps2、形成聚类最小点数量MinPts)按照以下方法确定。空间搜索半径Eps1、时间距离范围Eps2计算公式如以下公式确定:Eps2=|ts2-ts1|参数值的确定取决于数据分析场景。不同的应用案例,基站部署密度和人口活动模式可能不同。例如在验证研究案例,Eps1=500m、Eps2=2hours、MinPts=2。步骤S30:根据基站部署密度,采用一定半径缓冲区裁剪搜索区域,从而提高后期路径搜索计算速度。首先将各位置点按照时间顺序相连成线,以线建立缓冲区(图3所示)。步骤S40:以路网拓扑为基础,逐个轨迹分段,分别采用Dijkstra算法搜寻最短路径。将各分段最短路径相连形成用户移动轨迹地图匹配结果。步骤S50:评估环境下,以真实的GPS记录数据与地图匹配结果进行对比评价。应用环境下可省略此步骤。评估方法为准确率,即各子路径正确识别的轨迹长度之和与真是路径长度之比。采用1000条数据进行实验,结果显示识别3426条子轨迹,总行程距离为15684.23千米。以GPS数据为评价标准,地图匹配准确度为88.2%。平均每条数据处理时间为1.12秒。上述步骤即完成了地图匹配“快速模式”。下面步骤将解释“深度模式”实施方式,进一步提高匹配精度。由于已经将搜索空间限制到较小的空间范围,通过上述S40步骤的最短路径算法能识别城市路网中大部分的移动轨迹。若希望进一步优化地图匹配结果,本方法提供了如下可选的深度搜索优化步骤:步骤S60:以路网拓扑为基础,逐个轨迹分段,采用Yen’s算法计算搜寻top-k最短路径,形成k个最短路径集合。参数k由用户自由选择,一般k=5可满足实际使用要求。步骤S70:以轨迹点到路径的垂直距离为损失函数,优化匹配最优路径。轨迹点到路径的垂直距离为损失函数,优化匹配最优路径。距离计算方法如图4所示(包括情形A及情形B)。S80同S50步骤。“深度模式”下,以GPS数据为评价标准,地图匹配准确度为94.3%,比“快速模式”提高6.1%。平均每条数据处理时间为1.86秒,耗时比“快速模式”多0.74秒。以上所述,仅为本专利技术较佳的具体实施方式,但本专利技术的保护范围并不局限于此,任何熟悉本
的技术人员在本专利技术揭露的技术范围内,根据本专利技术的技术方案及其专利技术构思加以等同替换或改变,都应涵本文档来自技高网
...

【技术保护点】
1.一种基于信令数据的移动电话用户移动路径地图匹配方法,其特征在于:/n包括以下步骤:/nS10对信令数据进行预处理,完成异常值清理、相邻记录间移动速度计算;/nS20采用ST-DBSCAN算法进行时空聚类,聚类条件需设置空间半径r

【技术特征摘要】
1.一种基于信令数据的移动电话用户移动路径地图匹配方法,其特征在于:
包括以下步骤:
S10对信令数据进行预处理,完成异常值清理、相邻记录间移动速度计算;
S20采用ST-DBSCAN算法进行时空聚类,聚类条件需设置空间半径rs及时间距离rt,最少聚类点数MinPts以产生的聚类中心作为新的轨迹点分割轨迹,按照时间构建新的时序轨迹;
S30所述时序轨迹并以固定的缓冲区半径,形成范围较小的路径搜索空间,以路网拓扑为基础,对所述时序轨迹进行分段操作;
S40对分段轨迹分别采用Dijkstra算法搜寻最短路径并将多个所述分段轨迹的最短路径相连形成用户移动轨迹地图匹配结果。
S50以实际GPS记录数据与地图匹配结果进行对比评价匹配准确率的评估。


2.根据权利要求1所述的一种基于信令数据的移动电话用户移动路...

【专利技术属性】
技术研发人员:王末崔运鹏李欢侯颖刘娟陈丽
申请(专利权)人:中国农业科学院农业信息研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1