本发明专利技术公开了基于时空立方体的大规模时空近邻驻留对象发现方法,包括:获取所有移动对象的手机信令数据;初始化时空立方体中时空单元的大小;在时间序列中将手机信令数据记录转换为时空单元轨迹序列,同时计算不同时空单元的驻留标签和驻留时长;构建时空单元轨迹序列索引和时空单元内容快照索引;给定任意移动对象编号,高效准确挖掘出与其有时空近邻驻留伴随关系的移动对象。本发明专利技术的创新价值和有效应用场景是:不仅考虑了移动对象之间的时间和空间邻近度,也考虑了不同移动对象在相同时空区域内共同驻留时长的因素,为高效准确发现时空伴随者和密切接触者等类似应用提供一个新的解决思路。的解决思路。的解决思路。
【技术实现步骤摘要】
基于时空立方体的大规模时空近邻驻留对象发现方法
[0001]本专利技术涉及时空轨迹索引、时空数据挖掘领域,尤其涉及基于时空立方体的大规模时空近邻驻留对象发现方法。
技术介绍
[0002]病毒在人与人之间的传播一直以来都是全球公共卫生事业面临的重要问题。
[0003]突发传染病防控初期,流行病学调查(简称流调)是能够让潜在病毒携带者尽快得到排查的基本工作。传统方式主要依靠人工询问确诊病例发病前的暴露情况、接触情况、活动轨迹,然而上述做法十分依赖被调查对象的记忆,甚至部分被调查对象隐瞒行程、病情,给潜在病毒携带者的寻找带来不利影响。
[0004]随着移动通信、卫星导航定位技术的高速发展,近些年来移动手机的使用改变了移动对象的通信习惯,手机信令数据作为移动运营商计费服务的辅助产物,具有样本量大、人口覆盖广的天然优势,能够很好地还原出一个人的出行轨迹。
[0005]在大数据广泛应用的今天,时空轨迹数据挖掘具有非常高的应用价值。因此在传统流调方式的基础上,使用时空轨迹数据挖掘推断出确诊病例在被隔离之前的活动轨迹,再通过时空轨迹查询快速找到与其有过近距离接触的人群,不但能够提高流调的效率,也能够提高流调的准确性。基本上,如果被调查对象与确诊病例在时间和空间两个维度上存在交集,那么就可以认为该被调查对象是潜在病毒携带者。此外为了更加准确地筛查出潜在病毒携带者,需要进一步考虑在存在交集的时空区域内共同驻留时长因素,查询出共同驻留时长大于等于指定阈值的被调查对象,对其进行进一步的传染病筛查、隔离观察。
[0006]因此,如何高效准确地找到与确诊病例出现在相同时间范围、相同空间范围且共同驻留时长大于等于指定阈值的移动对象,这是本领域目前需要解决的问题。
技术实现思路
[0007]本专利技术的目的在于提供一种基于时空立方体的大规模时空近邻驻留对象发现方法,用来高效准确地找到与指定移动对象出现在相同时间范围、相同空间范围且共同驻留时长大于等于指定阈值的移动对象。
[0008]基于时空立方体的大规模时空近邻驻留对象发现方法,其特征在于,包括如下部分:
[0009](1)获取所有移动对象的手机信令数据。手机信令数据是由真实的移动对象产生,并做脱敏处理。
[0010](2)初始化时空立方体中时空单元的大小。其中时空单元做为时空立方体的基本存储单元和组成结构,时空单元大小需要根据时空近邻驻留对象发现所需要的时间和空间范围现实参数要求决定。
[0011](3)在时间序列中将手机信令数据记录转换为时空单元轨迹序列,同时计算不同时空单元的驻留标签和驻留时长。
[0012](4)构建时空单元轨迹序列索引和时空单元内容快照索引。其中生成的索引文件使用可控字节长度的二进制进行编码并存储到磁盘。
[0013](5)给定任意移动对象编号,挖掘出与其有时空近邻驻留伴随关系的移动对象。其中挖掘过程中的查询操作转变为对存储到磁盘上索引文件中字节偏移量的操作。
[0014]部分(1)中所述的手机信令数据记录了移动对象使用的手机与通信基站之间发生信息交互而产生的时间和空间位置信息。手机信令数据中每一条记录格式为(moid,lon,lat,t),其中moid代表移动对象编号,lon代表通信基站经度,lat代表通信基站纬度,t代表与通信基站建立交互而产生的时间。
[0015]部分(2)中时空近邻是指:指定时间段Δt(例如9:00~9:10,即10分钟)和空间范围Δs(例如800m
×
800m),如果不同移动对象的活动轨迹出现在该指定时空区域就认为有时空近邻关系,其中活动轨迹是指定移动对象的所有手机信令数据记录按照时间先后顺序排列而成。时空近邻驻留是指:指定驻留时长阈值Δt
′
,如果满足时空近邻关系的不同移动对象共同驻留时长大于等于Δt
′
就认为有时空近邻驻留关系,其中Δt
′
和Δt大小一致。时空近邻驻留对象发现是指:给定一组移动对象mo={mo1,
…
,mo
n
}、一组查询对象qo={qo1,
…
,qo
n
}、时间段Δt、空间范围Δs和驻留时长阈值Δt
′
,连续在移动对象mo中搜索与查询对象qo中有时空近邻驻留关系的对象,其中时空立方体中时空单元的大小由时间段Δt和空间范围Δs决定。
[0016]时空单元做为时空立方体的基本存储单元和组成结构,表现为空间网格单元为底、时间线性单元为高的均质立方体。时空单元的大小受到时间单位和空间单位的影响:时间单位是指在时空立方体中沿着时间轴划分的最小单位,与时间段大小一致,同样记为Δt;空间单位是指在时空立方体中沿着二维平面空间划分网格的最小单位,与空间范围大小一致,同样记为Δs;Δt
×
Δs代表了一个三维立方体,即时空单元,记为Δb。其中每一个时空单元都有唯一固定的编号stbid用来编码和索引,用来实现对所有时空单元的快速遍历与查找。
[0017]部分(3)中将每位移动对象的手机信令数据记录转换为时空单元轨迹序列,需要把手机信令数据中的每一条记录与时空单元编号建立起对应关系,具体的转换公式如下:
[0018][0019]其中,(lat
max
,lat
min
,lon
max
,lon
min
)代表所需研究时空区域的空间范围,t
start
代表所需研究时空区域的起始时间,latnum代表所需研究时空区域在现实世界中二维平面空间沿着经度轴以指定空间单位划分的格网数量,latnum代表所需研究时空区域在现实世界中二维平面空间沿着纬度轴以指定空间单位划分的格网数量,stbid代表时空单元编号,tid代表移动对象手机信令数据中每一条记录所对应的时空单元在时空立方体中所处的层数,sid代表移动对象手机信令数据中每一条记录所对应的时空单元在时空立方体任意一层中所处的位置编号,代表向下取整。在将移动对象的手机信令数据转换为时空单元轨迹序列的同时,计算移动对象在不同时空单元的驻留标签和驻留时长。
[0020]为了能够更好地得到移动对象在不同时空单元的驻留标签和驻留时长,需要计算移动对象在其每一条记录中所处空间位置的初始时间和结束时间。在时间序列中,由于每一条记录中的空间位置信息都是通信基站的经纬度坐标,当出现基站切换即前后相邻两条记录中通信基站经纬度坐标不一致时,将后一条记录中的时间作为后一条记录的初始时间、作为前一条记录的结束时间,依此类推,根据每一条记录的初始时间和结束时间可以得到在该条记录的驻留时长,同时使用转换公式得到每一条记录对应的初始时空单元和结束时空单元,在此基础上计算初始时空单元和结束时空单元及其范围内所经过时空单元的驻留标签和驻留时长。
[0021]所述驻留标签分为四类,分别是上驻留、部分驻留、完全驻留和下驻留。上驻留的基本特征是该条记录的驻留时长需要使用两个及两个以本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于时空立方体的大规模时空近邻驻留对象发现方法,其特征在于,包括如下部分:S1.获取所有移动对象的手机信令数据;手机信令数据是由真实的移动对象产生;S2.基于S1的手机信令数据,初始化时空立方体中时空单元的大小;其中时空单元做为时空立方体的基本存储单元和组成结构,时空单元大小需要根据时空近邻驻留对象发现所需要的时间和空间范围现实参数要求决定;S3.基于S2,在时间序列中将手机信令数据记录转换为时空单元轨迹序列,同时计算不同时空单元的驻留标签和驻留时长;S4.基于S3,构建时空单元轨迹序列索引和时空单元内容快照索引;其中生成的索引文件使用可控字节长度的二进制进行编码并存储到磁盘;S5.基于S4,给定任意移动对象编号,挖掘出与其有时空近邻驻留伴随关系的移动对象;其中挖掘过程中的查询操作转变为对存储到磁盘上索引文件中字节偏移量的操作。2.根据权利要求1所述的基于时空立方体的大规模时空近邻驻留对象发现方法,其特征在于,步骤S1中所述的手机信令数据记录了移动对象使用的手机与通信基站之间发生信息交互而产生的时间和空间位置信息;手机信令数据中每一条记录格式为(moid,lon,lat,t);其中moid代表移动对象编号,lon代表通信基站经度,lat代表通信基站纬度,t代表与通信基站建立交互而产生的时间。3.根据权利要求1所述的基于时空立方体的大规模时空近邻驻留对象发现方法,其特征在于,步骤S2中时空近邻驻留对象发现是指:给定一组移动对象mo={mo1,...,mo
n
}、一组查询对象qo={qo1,...,qo
n
}、时间段Δt、空间范围Δs和驻留时长阈值Δt
′
,连续在移动对象mo中搜索与查询对象qo中有时空近邻驻留关系的对象,其中时空近邻驻留关系是指出现在相同时间段Δt、相同空间范围Δs且共同驻留时长大于等于驻留时长阈值Δt
′
;时空立方体中时空单元的大小由时间段Δt和空间范围Δs决定。4.根据权利要求3所述的基于时空立方体的大规模时空近邻驻留对象发现方法,其特征在于:时空立方体是一个三维立方体:使用二维坐标轴表示现实世界中的平面空间,使用一维时间轴表示现实世界中平面空间位置沿着时间的变化;时空单元做为时空立方体的基本存储单元和组成结构,其大小受到时间单位和空间单位的影响:时间单位是指在时空立方体中沿着时间轴划分的最小单位,与权利要求3所述的时间段大小一致,同样记为Δt;空间单位是指在时空立方体中沿着二维平面空间划分网格的最小单位,与权利要求3所述的空间范围大小一致,同样记为Δs;其中每一个时空单元都有唯一固定的编号stbid用来编码和索引。5.根据权利要求1所述的基于时空立方体的大规模时空近邻驻留对象发现方法,其特征在于,步骤S3中将每位移动对象的手机信令数据记录转换为时空单元轨迹序列,需要把手机信令数据中的每一条记录与时空单元编号建立起对应关系,具体的转换公式如下:其中,(lat
max
,lat
min
,lon
max
,lon
min
)代表所需研究时空区域的空间范围,t
start
代表所...
【专利技术属性】
技术研发人员:林绍福,常小林,刘希亮,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。