一种基于Hbase和向量数据库的轨迹检索方法、系统及介质技术方案

技术编号:41711418 阅读:38 留言:0更新日期:2024-06-19 12:40
本发明专利技术公开了一种基于Hbase和向量数据库的轨迹检索方法、系统及介质,属于时空数据挖掘技术领域。本发明专利技术的技术方案中,基于Hbase和向量数据库的轨迹检索方法首先通过利用预训练模型获取轨迹的嵌入向量,解决了轨迹相似度难以衡量的问题;其次,利用向量数据库对轨迹进行相似检索,有效解决了嵌入向量检索效率低的问题;最后,结合Hbase非关系型分布式数据库的特性,进一步提高了检索效率。

【技术实现步骤摘要】

本专利技术涉及时空数据挖掘,更具体的说是涉及一种基于hbase和向量数据库的轨迹检索方法、系统及介质。


技术介绍

1、随着各种智能设备和传感器的广泛使用,产生了越来越多的位置数据。无论是智能手机上的地图导航、社交媒体上的位置标签,还是物联网中的智能家居系统,位置数据都扮演着重要的角色。

2、自openai公司推出了chatgpt以来,chatgpt被认为是人工智能里程碑式应用。chatgpt背后的预训练技术目前已经成为自然语言处理领域以及计算机视觉领域全新的技术范式。在大规模轨迹检索领域,目前常用的方法仍然是基于传统的结构化或者半结构化数据库以及轨迹相似度度量算法。受采样率、噪声以及计算复杂度的影响,轨迹相似度度量问题一直面临着巨大的挑战。作为chatgpt的核心技术之一的向量数据库是一种特殊的数据库,它将预训练过的文本或者图像转化为多维向量的形式保存。向量数据库的主要优点是它能够根据数据的向量的相似性快速检索数据。hbase作为非关系型分布式存储系统,具有高可靠性、高性能、可伸缩等特性,适合海量轨迹数据存储。

3、如何结合向量数据本文档来自技高网...

【技术保护点】

1.一种基于Hbase和向量数据库的轨迹检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于Hbase和向量数据库的轨迹检索方法,其特征在于,所述多源异构轨迹数据包括卡口车辆轨迹数据、摄像头人脸轨迹数据以及移动信令中的轨迹数据;

3.根据权利要求1所述的一种基于Hbase和向量数据库的轨迹检索方法,其特征在于,步骤1中,数据预处理具体包括以下步骤:

4.根据权利要求1所述的一种基于Hbase和向量数据库的轨迹检索方法,其特征在于,步骤1中,将数据预处理后的多源异构轨迹数据进行粗粒度网格化处理和细粒度网格化处理,具体包括:

...

【技术特征摘要】

1.一种基于hbase和向量数据库的轨迹检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于hbase和向量数据库的轨迹检索方法,其特征在于,所述多源异构轨迹数据包括卡口车辆轨迹数据、摄像头人脸轨迹数据以及移动信令中的轨迹数据;

3.根据权利要求1所述的一种基于hbase和向量数据库的轨迹检索方法,其特征在于,步骤1中,数据预处理具体包括以下步骤:

4.根据权利要求1所述的一种基于hbase和向量数据库的轨迹检索方法,其特征在于,步骤1中,将数据预处理后的多源异构轨迹数据进行粗粒度网格化处理和细粒度网格化处理,具体包括:

5.根据权利要求1所述的一种基于hbase和向量数据库的轨迹检索方法,其特征在于,步骤3中,构建的所述轨迹预训练模型包括bert对比预训练模型。

6.根据权利要求5所述的一种基于hbase和向量数据库的轨迹检索方法,其特征在于,步骤3中,对细粒度网格化处理后的多源异构...

【专利技术属性】
技术研发人员:蒋志鹏张建宇戴帅夫李莉
申请(专利权)人:北京九栖科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1