大规模轨迹数据时空伴随者查询方法和系统技术方案

技术编号:36543058 阅读:24 留言:0更新日期:2023-02-01 16:47
一种大规模轨迹数据时空伴随者查询方法和系统,属于时空大数据处理与应用的领域。本发明专利技术分为索引建立阶段和轨迹时空伴随者查询阶段,在索引建立阶段,基于样本数据构造一个全局索引,全局索引由时间分区的排序数组和空间分区的多个四叉树组成。具体来说,本方法遵循两轮连接框架。在第一轮连接中,根据时空分布对轨迹进行划分,每个时空分区中首先在根轨迹集上构建局部三维R树索引,再找到每条轨迹的动态区域,使得满足空间邻近性和时间并发性的最近邻居必须位于特定网格范围内,实现了数据的时空局部性和负载平衡。其次,在对局部结果进行洗牌之前,先基于时空参考点去除重复数据,可以有效地减少不同机器之间的数据传输。然后将局部结果合并成全局结果。最后,建立起全局索引

【技术实现步骤摘要】
大规模轨迹数据时空伴随者查询方法和系统


[0001]本专利技术属于时空大数据处理与应用领域,具体涉及一种基于多级索引结构的大规模轨迹数据时空伴随者查询方法。

技术介绍

[0002]高精度无线电导航的定位相关技术在轨迹数据采集领域冲云破雾,极大地丰富了时空数据的来源。这些数据包括点、线、多边形等各种几何类型,或者它们的混合。在现实生活中,万事万物都在相对运动中,对特定对象进行追踪,就可以获取到轨迹数据。对大规模轨迹数据的时空伴随查询具有非常广泛的应用前景,例如:在日常生活中进行需求推荐,在城市建设时进行道路规划等。但是在流行病预防的情况下,由于所获得的轨迹数据只考虑空间紧密性,并不符合时空伴随者的要求,所以需要考虑时间并发性,进行科学的动态表示。时空伴随者的应用可以拓展到更多细节,例如在打车时进行拼车,同伴检测和旅游推荐。
[0003]然而,由于时空数据具有以下的特点:第一,海量性,时空数据以极高的频率不间断产生,导致数据量庞大;第二,高维性,时间与空间分属两个维度,如何在处理空间信息的基础上处理时间信息需要进一步分析;第三,形状多样性:时空数据具有多种几何类型。综上,需要基于同时支持时间与空间的分布式框架进行研究。
[0004]利用大数据分析技术可以处理大规模时空数据,从中筛选出与输入轨迹时空重合的对象集。查询得到的“时空伴随者”,就是在尽可能短的时间找到风险人群,对采取必要防控措施的意义重大。另外由于轨迹数据具有非结构化、时效性强、规模庞大等特点,对传统轨迹数据处理系统的实时存储、实时查询的能力提出了挑战。时空伴随者是在疫情环境下催生的新概念,而时空伴随者查询对于疫情的控制具有重大意义,能及时阻断复杂的传播链。而对于轨迹查询的研究前人已经进行了许多,也是当下热门的研究领域,但是考虑时空累计因素的查询当前的工作并没有很多,尤其是具有轨迹时空伴随者查询功能并且可以基于内存的分布式轨迹处理系统很少。
[0005]目前可用于大型时空数据的解决方案多数支持使用R树进行时空分区和索引。因此,这些系统支持时空过滤和连接操作。但时间和空间的维度并不相同。划分的分区完全基于空间进行,查询的时间部分用于排除不符合时间约束的数据对象。本质上,时间维度被认为是另一个可查询维度,但是如果时间约束非常有选择性,则不能用于数据的剪枝。ST

Hadoop(LouaiA,MohamedFM.ADemonstrationofST

Hadoop:AMapReduceFrameworkforBigSpatio

temporalData[J].ProceedingsoftheVLDBEndowment,2017,10(12):1961

1964)是Hadoop的开源MapReduce的扩展,适用于时空数据处理。对时空索引的支持是ST

Hadoop的核心特性。这是通过空间索引的多级时间层次结构实现的。每个级别对应一个特定的时间分辨率(例如,日期、月份等)。然而,在每个级别,整个数据集都只会根据特定的时间分辨率级别进行复制和时空分区。并且ST

Hadoop仅支持时空范围查询、聚合和时空连接。Li等人(LiR,WangR,LiuJ,etal.DistributedSpatio

Temporal
kNearestNeighborsJoin[C].Sigspatial'21:29thInternationalConferenceonAdvancesinGeographicInformationSystems,Beijing,China,2021:435

445.)专利技术了一种有效地支持多种几何类型的ST

kNN连接的分布式系统。执行ST

kNN连接时虽然通过分区中的参数调整完成了对轨迹数据时间并发的筛查,但并不能实现轨迹时间戳的累计,即同一轨迹中各个采样时间点上轨迹点的网格重叠范围内的时空伴随查询。并且ST

kNN对轨迹点间的间距大小缺少考虑,在对局部结果进行洗牌之前,选取出来的时空参考点并不能有效地代表时空信息参加划分分区中重复数据的去除与备选轨迹集筛选。因此,做到对时空分区的特定选择并采取及时有效的应对措施,实现轨迹时空伴随者等重要功能是如今科研领域中值得被关注的热点问题。

技术实现思路

[0006]为了解决上述提出的准确进行大规模轨迹数据时空伴随查询的问题,本专利技术在第一方面方面上,根据本申请一些实施例的一种大规模轨迹数据时空伴随者查询方法,包括
[0007]获取输入轨迹;
[0008]根据所述输入数据查询所述时空伴随者的轨迹;
[0009]根据所述时空伴随者的轨迹确定时空伴随者。
[0010]根据本申请一些实施例的一种大规模轨迹数据时空伴随者查询方法,根据所述输入数据查询所述时空伴随者的轨迹,包括
[0011]将轨迹数据集中的轨迹进行分区,获取轨迹数据集各轨迹的时间分区和空间分区;
[0012]根据所述输入轨迹,获取输入轨迹所在时间范围;
[0013]根据所述时间范围,获取与所述时间范围相交的轨迹数据集各轨迹的时间分区以及该时间分区所对应轨迹;
[0014]根据所述输入轨迹,获取所述输入轨迹的轨迹点在所述对应轨迹的空间分区的最近邻轨迹点;
[0015]获取所述输入轨迹的最近邻轨迹,所述最近邻轨迹点所在轨迹数据集的轨迹是所述输入轨迹的最近邻轨迹;
[0016]根据所述最近邻轨迹中的所述最近邻轨迹点在时间分区的划分,获取所述最近邻轨迹的时间累计,时空伴随者的轨迹是累计时间超过时间阈值的所述最近邻轨迹;
[0017]根据本申请一些实施例的一种大规模轨迹数据时空伴随者查询方法,所述轨迹数据集各轨迹的空间分区的轨迹包括开始时间与结束时间,按照匀速运动为所述轨迹的轨迹线上每一个轨迹点创建时间戳,所述轨迹数据集各轨迹的空间分区的轨迹点的信息包括所轨迹点所在轨迹的标识符。
[0018]根据本申请一些实施例的一种大规模轨迹数据时空伴随者查询方法,每条轨迹中每个轨迹点为定义的元组。
[0019]根据本申请一些实施例的一种大规模轨迹数据时空伴随者查询方法,所述获取所述输入轨迹的轨迹点在所述对应轨迹的空间分区的最近邻轨迹点,包括
[0020]将所述输入轨迹的轨迹点在所述轨迹数据集各轨迹的空间分区进行两轮局部kNN搜索,将两轮局部kNN搜索结果生成全局结果,根据所述全局结果获取输入轨迹的轨迹点到
所述轨迹数据集各轨迹的空间分区的轨迹点的空间距离;
[0021]根据所述空间距离确定所述输入轨迹的轨迹点的最近邻轨迹点排序的优先级,根据所述优先级,获得输入轨迹点对应的所述轨迹数据集各轨迹的空间分区的轨迹点的排序结果;
[0022]输入轨迹的轨迹点的最近邻筛选的全局结果中的前k个所述轨迹数据集对应轨迹的空间分区的轨迹点是所述输入轨迹的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大规模轨迹数据时空伴随者查询方法,其特征在于,包括:获取输入轨迹;根据所述输入数据查询所述时空伴随者的轨迹;根据所述时空伴随者的轨迹确定时空伴随者。2.根据权利要求1所述的大规模轨迹数据时空伴随者查询方法,其特征在于,根据所述输入数据查询所述时空伴随者的轨迹,包括将轨迹数据集中的轨迹进行分区,获取轨迹数据集各轨迹的时间分区和空间分区;根据所述输入轨迹,获取输入轨迹所在时间范围;根据所述时间范围,获取与所述时间范围相交的轨迹数据集各轨迹的时间分区以及该时间分区所对应轨迹;根据所述输入轨迹,获取所述输入轨迹的轨迹点在所述对应轨迹的空间分区的最近邻轨迹点;获取所述输入轨迹的最近邻轨迹,所述最近邻轨迹点所在轨迹数据集的轨迹是所述输入轨迹的最近邻轨迹;根据所述最近邻轨迹中的所述最近邻轨迹点在时间分区的划分,获取所述最近邻轨迹的时间累计,时空伴随者的轨迹是累计时间超过时间阈值的所述最近邻轨迹。3.根据权利要求2所述的大规模轨迹数据时空伴随者查询方法,其特征在于,所述轨迹数据集各轨迹的空间分区的轨迹包括开始时间与结束时间,按照匀速运动为所述轨迹的轨迹线上每一个轨迹点创建时间戳,所述轨迹数据集各轨迹的空间分区的轨迹点的信息包括所轨迹点所在轨迹的标识符。4.根据权利要求3所述的大规模轨迹数据时空伴随者查询方法,其特征在于,每条轨迹中每个轨迹点为定义的元组。5.根据权利要求3所述的大规模轨迹数据时空伴随者查询方法,其特征在于,所述获取所述输入轨迹的轨迹点在所述对应轨迹的空间分区的最近邻轨迹点,包括将所述输入轨迹的轨迹点在所述轨迹数据集各轨迹的空间分区进行两轮局部kNN搜索,将两轮局部kNN搜索结果生成全局结果,根据所述全局结果获取输入轨迹的轨迹点到所述轨迹数据集各轨迹的空间分区的轨迹点的空间距离;根据所述空间距离确定所述输入轨迹的轨迹点的最近邻轨迹点排序的优先级,根据所述优先级,获得输入轨迹点对应的所述轨迹数据集各轨迹的空间分区的轨迹点的排序结果;输入轨迹的轨迹点的最近邻筛选的全局结果中的前k个所述轨迹数据集对应轨迹的空间分区的轨迹点是所述输入轨迹的轨迹点的所述最近邻轨迹点。6.根据权利要求3所述的大规模轨迹数据时空伴随者查询方法,其特征在于,获取所述最近邻轨迹的方法包括通过根据所述邻轨迹的所述标识符,通过全局索引获取所述输入轨迹的轨迹点的最近邻轨迹点所在轨迹数据集的轨迹是所述...

【专利技术属性】
技术研发人员:齐恒张志齐文瑞申彦明
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1