基于p-stable lsh的时空伴随查询方法技术

技术编号:28941851 阅读:132 留言:0更新日期:2021-06-18 21:47
本发明专利技术公开了基于p‑stable lsh的时空伴随查询方法,包括:获取时空伴随对象轨迹的离线数据,对所述离线数据进行预处理,生成多维向量数据;基于p‑stable lsh算法将所述多维向量数据生成离线的对象轨迹的数字签名;将所述离线的数字签名同步至在线的数据查询大数据库中;基于所述在线的数据查询大数据库,构建快速检索工具,根据所述数字签名查询相似目标对象。采用p‑stable lsh算法对整个轨迹做hash变换,使得轨迹维度大大降低,将复杂的伴随分析转变成指纹(hash值)比对,极大地提高了查询效率及查询效果,同时采用geohash做经纬度降维,对一定范围内的经纬度误差可以完成归一化处理。此外,采用在线和离线结合的方式,极大的提升了用户体验。

【技术实现步骤摘要】
基于p-stablelsh的时空伴随查询方法
本专利技术涉及数据处理的
,具体涉及基于p-stablelsh的时空伴随查询方法。
技术介绍
时空轨迹是移动对象的位置和时间的记录序列。作为一种重要的时空对象数据类型,时空轨迹的应用涵盖了人类行为、交通物流等诸多方面。通过对各种时空轨迹数据进行分析,可以得到时空轨迹数据中的相似性异常特征,有助于发现其中有意义的轨迹模式。伴随模式是时空轨迹模式中的一种,在交通管理,资源分配等领域有着重要的应用。现有技术中,对时空轨迹的移动对象进行查询方法一般采用geohash做时空轨迹伴随,或者,将相邻的几个基站划分成一个组并给一个组编号。然后利用组编号来做基于基站的时空轨迹伴随。此方法仅适用于基站轨迹,并且对基站分组的要求较高,分组的效果直接影响最终伴随结果。但是,现有技术的方案都只是针对经纬度做hash变换,将经纬度降维。在时空比对过程中,依然要通过统计、碰撞等业务逻辑来实现,效率和效果方面都大打折扣,尤其是在海量数据情况下,效率低及效果差的问题显得尤为突出。因此,亟需一种可以提高查询效率及本文档来自技高网...

【技术保护点】
1.基于p-stable lsh的时空伴随查询方法,其特征在于,包括:/n获取时空伴随对象轨迹的离线数据;/n对所述离线数据进行预处理,生成多维向量数据;所述预处理包括基于geohash算法按照时间节点生成的针对对象轨迹的位置点经纬度的多维向量数据;/n基于p-stable lsh算法将所述多维向量数据生成离线的对象轨迹的数字签名;/n将所述离线的数字签名同步至在线的数据查询大数据库中;/n基于所述在线的数据查询大数据库,构建快速检索工具,根据所述数字签名查询相似目标对象。/n

【技术特征摘要】
1.基于p-stablelsh的时空伴随查询方法,其特征在于,包括:
获取时空伴随对象轨迹的离线数据;
对所述离线数据进行预处理,生成多维向量数据;所述预处理包括基于geohash算法按照时间节点生成的针对对象轨迹的位置点经纬度的多维向量数据;
基于p-stablelsh算法将所述多维向量数据生成离线的对象轨迹的数字签名;
将所述离线的数字签名同步至在线的数据查询大数据库中;
基于所述在线的数据查询大数据库,构建快速检索工具,根据所述数字签名查询相似目标对象。


2.根据权利要求1所述的基于p-stablelsh的时空伴随查询方法,其特征在于,所述对所述离线数据进行预处理,生成多维向量数据,包括:
将对象轨迹的所有位置点基于geohash算法进行编码;
按照预先设定的时间片段长度将预设的总时间长度进行时间切片处理,将总的时间长度切分为若干个时间切片;
对每个时间切片中的位置点的出现的geohash编码进行排序,提取出现次数最多的geohash编码作为相应位置点的geohash编码;
将所有时间切片中的相应位置点geohash编码的经纬度数据提取形成多维向量数据。


3.根据权利要求1所述的基于p-stablelsh的时空伴随查询方法,其特征在于,基于p-stablelsh算法将所述多维向量数据生成离线的对象轨迹的数字签名,包括:
对所述多维向量数据中的每个向量附加hash值;
根据哈希碰撞概率公式确定分桶大小w;



其中,w是分桶大小;c代表欧式距离;t的取值范围根据不同地区的经纬度最大最小值确定;p根据经验值一般取0.7以上;f是在高斯概率分布函数,函数公式如下:



其中,μ为数学期望,σ为标准差;
根据所述分桶大小及多维向量数据的总数量确定分桶的数量;
根据所述分桶的数量确定hash值的数量;
将确定数量的hash值设定为相应数量的数字签名。


4.根据权利要求3所述的基于p-stablelsh的时空伴随查询方法,其特征在于,所述将确定数量的hash值设定为相应数量的数字签名,包括:
将所述hash值进行分类存储,每类中包含若干个hash值;
将每一类中的hash值进行合并处理,每一类确定一个合并后的hash值;
将所述合并后的hash值作为相应类的数字签名。
<...

【专利技术属性】
技术研发人员:胡宇飞陈成斌叶智慧苏胜林马军亮
申请(专利权)人:中睿信数字技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1