一种基于轨迹表示学习的相似度查询优化方法技术

技术编号：36188138 阅读：39 留言：0更新日期：2022-12-31 20:57

本发明专利技术公开了一种基于轨迹表示学习的相似度查询优化方法，本发明专利技术的轨迹相似度查询是将轨迹表示成向量，在向量空间利用两个向量之间的欧氏距离找到离查询轨迹距离最近的轨迹。本发明专利技术提出了一种基于路网分区的轨迹表示学习模型PT2vec，PT2vec考虑了轨迹的空间特征和底层路网的拓扑约束将轨迹嵌入到低维向量空间，设计一个基于空间和拓扑信息的损失函数，加快模型的训练，提高模型准确度，并有效的解决了大规模轨迹相似度计算时间过大的问题。同时为了减小轨迹查询空间，提高查询效率，使用PT

全部详细技术资料下载

【技术实现步骤摘要】
一种基于轨迹表示学习的相似度查询优化方法

[0001]本专利技术属于时空数据管理
，具体涉及一种基于轨迹表示学习的相似度查询优化方法，基于路网分区的深度表示学习模型(PT2vec)和针对轨迹相似度查询的PT
‑
GTree索引，用来实现大规模轨迹数据的相似度查询。

技术介绍

[0002]随着物联网和车联网技术中位置获取的快速发展，已经产生了可用于描述运动物体的多样性和属性的轨迹数据。轨迹模式分析和管理已经成为近几十年来的一个关键问题，因为它支持许多领域和应用(例如，智能城市、智能交通、基于位置的服务、健康管理等)。由于最近人工智能技术的发展，可以利用人工智能技术以前所未有的规模分析轨迹数据，以评估智能交通系统(ITS) 中有关有效性、效率准确性和隐私的适用问题。传统的大规模轨迹数据研究主要集中在轨迹相似度计算、轨迹聚类、轨迹异常检测等方面，并使用R
‑
tree索引和网格索引等技术建立索引结构。目前随着深度学习技术的快速发展，深度表示学习技术不仅能够从形式上对原始轨迹进行规范和简化还可以从冗余的原始信息中提取出有价值的部分，从而使轨迹模式分析和管理更加高效。
[0003]现有的轨迹相似度度量方法，如动态时间包装(DTW)、最长公共子序列(LCSS) 和编辑距离实序列(EDR)。然而，现有的传统方法通常采用动态规划来确定两个轨迹的成对点匹配的最佳对齐，这导致了二次计算复杂度。但是，当轨迹规模很大时这些方法不适用。
[0004]早期的轨迹表示方法大多是基于人工设计的特...

【技术保护点】

【技术特征摘要】
1.基于路网划分的轨迹表示学习和相似度查询方法，其特征在于，包括如下步骤：S1:对路网进行分区，并对每个分区及边界边按顺序排号赋予标签单词，构建词汇表；S2:获取多条原始轨迹，基于上述词汇表，对原始轨迹进行路网匹配，将匹配后的轨迹序列转换为词序列；S3:根据分区结果构建PT
‑
GTree，将步骤S2中匹配后的轨迹存储到PT
‑
GTree最小公共祖先节点中，针对轨迹相似性查询，利用PT
‑
GTree对查询数据库进行剪枝，确定查询候选轨迹集；S4:构建基于GRU的编码器
‑
解码器模型，使用步骤S2中的词序列作为输入，经过编码器将其编码为低维的潜在向量v，然后通过解码器解码出一个输出序列y，同时设计一种基于空间和拓扑信息的损失函数对该模型进行训练；S5:利用训练好的编码器
‑
解码器模型将步骤S3中确定的候选轨迹嵌入到低维向量空间，将候选轨迹都表示成向量的形式，使用两个轨迹向量之间的欧氏距离来表示轨迹的相似程度，距离越小轨迹越相似。2.按照权利要求1所述的基于路网划分的轨迹表示学习和相似度查询方法，其特征在于：步骤S1中，利用多层划分算法对路网进行划分，具体的，对路网的顶点和边缘进行粗化来减少网络规模；使用Kernighan
‑
Lin网络划分算法对粗化的路网图上进行划分形成多个子图；通过设定两个参数m和n进行划分，其中m为每个子图中路网节点的个数；n为划分子图的数量；对子图进行解粗，生成原始网络的最终分区，对最终分区和边界边按顺序编号赋予标签，每个标签对应相应的单词，这些单词组成词汇表。3.按照权利要求1所述的基于路网划分的轨迹表示学习...

【专利技术属性】
技术研发人员：李佳佳，王明申，赵颖，李雷，
申请(专利权)人：沈阳航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人