System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及轨迹数据分区,具体而言,尤其涉及一种历史数据支持的动态轨迹分区方法、存储介质及电子设备。
技术介绍
1、对动态轨迹数据进行分区可以提高轨迹数据处理的效率和准确性,支持时空约束的查询和分析,适应实时轨迹数据的管理,并为轨迹数据挖掘和分析提供基础。
2、对国内外研究总结,现有的方法主要包括两类,一类是单机优化,即通过连接键对表进行合并,避免使用shuffle技术来查询和分析数据。另一类是使用分布式系统,对轨迹数据进行分区存储,利用集群的计算能力提高查询分析的性能。随着数据的急速增长,分布式的分区方法更适合大规模的轨迹数据。
3、现有的方法难以支持高效的动态轨迹分析,原因包括:(1)数据局域性问题:由于轨迹存储在不同的节点上,设计数据划分并保证数据相关性,从而降低数据的传输成本具有挑战性。(2)负载平衡问题:为保证数据均匀的分散在各个节点上,充分利用整个集群的计算能力具有挑战性;(3)增量分区时间问题:由于数据的动态增加会产生新的分区,设计重分区技术,降低重分区时间具有挑战性。
4、有鉴于此,本专利技术提供一种历史数据支持的动态轨迹分区方法、存储介质及电子设备。
技术实现思路
1、根据上述提出的不足,而提供一种历史数据支持的动态轨迹分区方法、存储介质及电子设备。本专利技术主要利用历史数据集生成基于历史数据的预分区,对于同一移动物体所产生的动态轨迹数据与历史数据存在空间相似,则可以直接以移动物体的唯一标识进行分区匹配,从而具有较优的分区负载
2、本专利技术采用的技术手段如下:
3、一方面,本专利技术提供了一种历史数据支持的动态轨迹分区方法,包括:
4、s1:读取历史数据集,所述历史数据集包括多个轨迹点,所述轨迹点包括移动物体标识;
5、s2:根据所述移动物体标识对多个所述轨迹点进行分类,得到多条轨迹,所述轨迹与所述移动物体标识一一对应;
6、s3:对多条所述轨迹进行相似计算,得到多个分区;
7、s4:计算所有所述分区的数量平均值,筛选出所有所述分区中的数量最小值;
8、s5:根据所述数量平均值、所述数量最小值和第i个分区的数量值计算所述第i个分区的平衡因子;
9、s51:若所述平衡因子大于参照值,将所述第i个分区进行二分分裂并更新分区情况,返回s4;
10、s52:若所述平衡因子小于等于所述参照值,形成第i预分区;
11、s6:当预分区划分完成后,动态轨迹点按照其移动物体标识寻找对应的所述预分区进行存储。
12、优选地,所述根据所述移动物体标识对多个所述轨迹点进行分类,得到多条轨迹,包括:
13、根据所述移动物体标识对多个所述轨迹点进行分类,得到多个轨迹点组,所述轨迹点组与所述移动物体标识一一对应;
14、将第y个轨迹点组中的所述轨迹点按照时间顺序排列,得到第y条轨迹。
15、优选地,所述对多条所述轨迹进行相似计算,包括:
16、所述相似计算采用fréchet相似计算。
17、优选地,所述根据所述数量平均值、所述数量最小值和第i个分区的数量值计算所述第i个分区的平衡因子,按照以下方式计算:
18、
19、其中,λi为所述第i个分区的平衡因子,为所述第i个分区的数量值,pmin为所述数量最小值,pave为所述数量平均值。
20、另一方面,本专利技术提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时,执行上述任一项所述的方法。
21、又一方面,本专利技术提供了一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器通过所述计算机程序运行执行上述任一项所述的方法。
22、较现有技术相比,本专利技术具有以下优点:
23、本专利技术提供的历史数据支持的动态轨迹分区方法、存储介质及电子设备,通过历史数据集划分预分区,当预分区划分完成后,动态轨迹点按照其移动物体标识寻找对应的预分区进行存储。对于同一移动物体所产生的动态轨迹数据与历史数据存在空间相似,则可以在使用历史数据划分预分区的情况下,直接以移动物体标识进行分区匹配,时间复杂度低,对于动态轨迹数据,本专利技术具有较优的分区负载能力。
本文档来自技高网...【技术保护点】
1.一种历史数据支持的动态轨迹分区方法,其特征在于,包括:
2.根据权利要求1所述的历史数据支持的动态轨迹分区方法,其特征在于,所述根据所述移动物体标识对多个所述轨迹点进行分类,得到多条轨迹,包括:
3.根据权利要求1或2所述的历史数据支持的动态轨迹分区方法,其特征在于,所述对多条所述轨迹进行相似计算,包括:
4.根据权利要求1或2所述的历史数据支持的动态轨迹分区方法,其特征在于,所述根据所述数量平均值、所述数量最小值和第i个分区的数量值计算所述第i个分区的平衡因子,按照以下方式计算:
5.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时,执行所述权利要求1至4中任一项权利要求所述的方法。
6.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序运行执行所述权利要求1至4中任一项权利要求所述的方法。
【技术特征摘要】
1.一种历史数据支持的动态轨迹分区方法,其特征在于,包括:
2.根据权利要求1所述的历史数据支持的动态轨迹分区方法,其特征在于,所述根据所述移动物体标识对多个所述轨迹点进行分类,得到多条轨迹,包括:
3.根据权利要求1或2所述的历史数据支持的动态轨迹分区方法,其特征在于,所述对多条所述轨迹进行相似计算,包括:
4.根据权利要求1或2所述的历史数据支持的动态轨迹分区方法,其特征在于,所述根据所述数量...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。