一种路网下地理社交关键字反最近邻查询处理方法技术

技术编号：16175711 阅读：62 留言：0更新日期：2017-09-09 02:56

本发明专利技术公开了一种路网下地理社交关键字反最近邻查询处理方法，利用GIM树对空间路网，文本，社交数据进行存储，并利用分支界限方法遍历索引；在遍历索引时本发明专利技术首先计算索引节点的最小相似性计数表与最大相似性计数表，而后利用上述最小相似性计数表和最大相似性计数表进行剪枝，并利用过滤、精炼算法以加速查询执行。本发明专利技术结合了空间数据库的现有技术，降低了地理社交文本相似性计算次数，从而提高了查询性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种路网下地理社交关键字反最近邻查询处理方法
本专利技术涉及空间数据库的索引与查询技术，是一种用于处理路网下地理社交关键字反最近邻查询的方法。
技术介绍
空间数据是指地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和，其目的是为了存储、管理和检索各种地理空间数据。其中，路网空间数据作为空间数据库的重要组成部分，得到了越来越多的关注。为了快速、有效地访问路网空间数据，专家学者们提出了许多路网空间数据索引方法。目前，G树索引方法是最有效的路网空间数据索引方法。它将路网划分成多个子图，并预先计算各边界点的路网距离，从而达到降低最短路径计算代价的目的。反最近邻查询由于其在决策支持和发现潜在用户等方面的重要应用而受到了学术界的广泛关注。在反最近邻查询的相关研究中，路网下空间关键字反最近邻查询被人们用来发现兴趣集。其中，兴趣集是指对某个兴趣点感兴趣的一群人。然而，路网下空间关键字反最近邻查询只考虑了文本和空间信息，并查找那些最有可能成为潜在用户的人群。随着社交网络的发展，社交网络数据的体量越来越大。在社交网络中，有社交联系的用户可能具有相似的兴趣爱好，因而这类数据可以为预测和推荐提供支持。基于此，人们研究了地理社交关键字查询。给定一个地理社交关键字查询和提交该查询的用户，此查询返回空间距离最近，文本相似性最高的兴趣点，并且该用户的朋友访问该兴趣点的次数最多。目前，针对路网下空间关键字反最近邻查询和地理社交关键字查询已有成熟的解决方案。但是在某些应用场景中，反最近邻查询不仅要考虑空间和文本信息，而且也要考虑用户之间的社交信息以及用户对兴趣点的签到信息...
一种路网下地理社交关键字反最近邻查询处理方法

【技术保护点】
一种路网下地理社交关键字反最近邻查询处理方法，其特征在于：该方法包括如下步骤：步骤(1)：收集用户与兴趣点，对其构建GIM树索引结构。步骤(2)：计算每个GIM树索引结构的节点的地理社交关键字的最小相似性计数表与最大相似性计数表。步骤(3)：利用剪枝算法对步骤(1)收集到的用户与兴趣点进行过滤。步骤(4)：根据步骤(3)中过滤的结果，通过精炼算法剔除不符合要求的用户，以得到最终结果集合。

【技术特征摘要】
1.一种路网下地理社交关键字反最近邻查询处理方法，其特征在于：该方法包括如下步骤：步骤(1)：收集用户与兴趣点，对其构建GIM树索引结构。步骤(2)：计算每个GIM树索引结构的节点的地理社交关键字的最小相似性计数表与最大相似性计数表。步骤(3)：利用剪枝算法对步骤(1)收集到的用户与兴趣点进行过滤。步骤(4)：根据步骤(3)中过滤的结果，通过精炼算法剔除不符合要求的用户，以得到最终结果集合。2.根据权利要求1所述的路网下地理社交关键字反最近邻查询处理方法，其特征在于：所述的步骤(1)中GIM树索引结构的构建步骤如下：将整个路网划分成多个子图，并将属于多个子图的路网节点定义为边界点；预先计算所有边界点之间的路网距离；每个GIM树索引结构节点包含一个路网子图、一个交并倒排文件和两个矩阵；交并倒排文件描述的是用户与兴趣点之间的文本信息；两个矩阵为用户签到矩阵和用户社交关系矩阵，用户签到矩阵存储用户对各兴趣点的签到次数，用户社交关系矩阵存储用户之间的社交关系。3.根据权利要求2所述的路网下地理社交关键字反最近邻查询处理算法，其特征在于：所述的步骤(2)中最小相似性计数表与最大相似性计数表的计算方法如下：给定一组用户和一组兴趣点，利用用户签到矩阵和用户社交关系矩阵这两个矩阵相乘计算用户和兴趣点之间地理社交关键字相似性的最小值和最大值；利用上述最小值和最大值构建用户的最小相似性计数表和最大相似性计数表。4.根据权利要求3所述的路网下地理社交关键字反最近邻查询处理方法，其特征在于：所述...

【专利技术属性】
技术研发人员：高云君，赵靖文，陈刚，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人