一种基于时空数据库的轨迹多维度分布式压缩方法技术

技术编号：33025613 阅读：16 留言：0更新日期：2022-04-15 08:59

本发明专利技术涉及一种基于时空数据库的轨迹多维度分布式压缩方法，包括如下步骤：步骤1、海量时空轨迹数据入库；步骤2、针对同一运动物体，插入其后续轨迹点数据时对其进行实时压缩，即多行数据压缩成一行数据；步骤3、当单一物体的轨迹点达到某一限定大小后，对其进行分表拆分处理，采用分布式压缩算法进行并行压缩存储待定。本发明专利技术提出了基于分布式时空数据库对海量轨迹数据进行多维度的压缩，在保留原始轨迹的主要轨迹特征的前提下，大大减少了轨迹数据的存储压力、节省了存储资源，同时大大减少了针对轨迹数据挖掘的计算资源。少了针对轨迹数据挖掘的计算资源。少了针对轨迹数据挖掘的计算资源。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于时空数据库的轨迹多维度分布式压缩方法

[0001]本专利技术涉及数据压缩
，尤其是一种基于时空数据库的轨迹多维度分布式压缩方法。

技术介绍

[0002]随着北斗全球卫星导航系统及5G通信技术的在各行各业的普及，无数终端产生了海量的北斗时空轨迹数据。
[0003]在处理轨迹数据时，传统的Douglas
‑
Peucker算法对每条轨迹的首末点虚连接一条直线，求其他所有轨迹点与这条直线的距离，并找到最大距离值d
max
,用d
max
与限差D相比：若 d
max
＜D，这条轨迹上的中间点全部舍掉；若d
max
＞D，保留d
max
对应的坐标点，并以该点为界，把轨迹分为两部分，分别对这两部分重复使用此方法。
[0004]Douglas
‑
Peucker算法用来处理时空轨迹数据存在两个问题：一是由于其仅仅以各个轨迹点到起始点连线的垂直欧式距离作为判断是否舍弃轨迹点的唯一判断标准，可能会去除掉一些具有明显轨迹特征的轨迹语义点，进而影响后续轨迹数据挖掘的相关效果；二是时间复杂度高，用它来直接处理海量的时空轨迹数据、或者一条具有巨量轨迹点的数据效率不太理想。
[0005]对于移动对象，基于时间戳的轨迹记录可以采用秒级记录，但是由于存储设备、计算能力等的限制，轨迹数据挖掘不需要如此精细的位置定位，通常需要采用轨迹压缩的方法来处理轨迹数据。

技术实现思路

[0006...

【技术保护点】

【技术特征摘要】
1.一种基于时空数据库的轨迹多维度分布式压缩方法，其特征在于，包括如下步骤：步骤1、海量时空轨迹数据入库；步骤2、针对同一运动物体，插入其后续轨迹点数据时对其进行实时压缩，即多行数据压缩成一行数据；步骤3、当单一物体的轨迹点达到某一限定大小后，对其进行分表拆分处理，采用分布式压缩算法进行并行压缩存储。2.根据权利要求1所述的一种基于时空数据库的轨迹多维度分布式压缩方法，其特征在于，所述步骤1具体包括：步骤1.1、在分布式数据库中创建分区表；步骤1.2、将包含时间、经纬度、速度、方向等信息的单个轨迹点数据作为一条行数据插入到分布式时空数据库中。3.根据权利要求1所述的一种基于时空数据库的轨迹多维度分布式压缩方法，其特征在于，所述步骤2中的实时压缩具体包括：步骤2.1、保留轨迹首尾两点；步骤2.2、依次计算相邻两个轨迹点之间速度差及方向角差值，如果速度差值大于阈值或者方向角差值大于阈值，则该轨迹点应当保留，记做突变点，总共有N个；步骤2.3、计算完成后，所有突变点将原始轨迹切分成N+1段子轨迹；步骤2.4、分别在N+1个子轨迹段中，将子轨迹首尾两个轨迹点之间连接一条直线，对于第i
‑
1个点C
i
‑1和第i个点C
i
之间的子轨迹段，遍历子轨迹段上其他所有点，求每个点到直线的垂直欧式距离，找到最大距离的点D，最大距离记为dmax；步骤2.5、比较该距离dmax与预先定义的阈值Dmax大小，如果dmax<Dmax，则将该直线C
i
‑1C
i
...

【专利技术属性】
技术研发人员：周健，
申请(专利权)人：中科星图股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人