当前位置: 首页 > 专利查询>深圳大学专利>正文

一种面向空间文本数据的空间结构匹配方法组成比例

技术编号:31912116 阅读:28 留言:0更新日期:2022-01-15 12:52
本发明专利技术公开了一种面向空间文本数据的空间结构匹配方法,构建由点边集合组成的连通图表征空间结构,点包含关键字属性,边包含距离约束区间和方向约束区间,基于距离约束区间确定空间结构中的最大距离,之后根据关键字筛选空间文本数据库获取匹配的对象点放入候选集合,筛选出候选集合中某一方向距离小于最大距离的点对,之后根据空间结构的关键字、距离约束区间和方向约束区间进行复核,最终将剩余的对象关系进行聚合以返回用户所需的查询结果。在不需要建立索引的情况下,本发明专利技术能够避免了冗余的计算操作,提高了查询的效率,可应用于面向空间文本数据的空间结构匹配。面向空间文本数据的空间结构匹配。面向空间文本数据的空间结构匹配。

【技术实现步骤摘要】
一种面向空间文本数据的空间结构匹配方法


[0001]本专利技术涉及空间文本数据领域,具体涉及一种面向空间文本数据的空间结构匹配方法。

技术介绍

[0002]随着基于位置服务(Location

based Service,LBS)的日益流行,大量的空间地理空间位置数据与文本数据结合产生海量的空间文本对象,这些对象通常被称为空间文本数据对象(spatial

textual data object)。对海量空间文本数据的处理分析可以进一步衍生出各类智慧城市应用,大量的研究提出了各种方法来查询和搜索空间文本数据库。现有的相关研究主要包括空间关键字查询和空间模式匹配方面的研究。其中,空间关键字查询(Spatial Keyword Query,SKQ)主要分为空间查询和关键字查询,目标是找出包含查询关键字且距离查询位置最近的若干对象。研究者已经开创了不同类型的SKQ,如m

最近关键字查询(m

closest keywords query,mCK)[Chan,H.K.H.,Long,C.and Wong,R.C.W.,2018.On generalizing collective spatial keyword queries.IEEE Transactions on Knowledge and Data Engineering,30(9),pp.1712

1726.]和集体关键词查询(Collective spatial keyword query,CoSKQ)[Long,C.,Wong,R.C.W.,Wang,K.and Fu,A.W.C.,2013,June.Collective spatial keyword queries:a distance owner

driven approach.In Proceedings of the 2013ACM SIGMOD International Conference on Management of Data(pp.689

700).]等。mCK用于寻找数据库中覆盖所有查询关键字且直径最小的空间对象组,其中直径表示对象组中相距最远的两个空间对象的距离。CoSKQ在数据库中查找一个对象组,而这个对象组以最小的成本共同覆盖一组给定的关键字。尽管这些SKQ可以解决一部分问题,但它只返回一组特别的对象分布的结果,不能准确地代表用户的查询意图。SKQ方法的不足之处:传统的SKQ问题一般仅考虑空间对象组的最大距离约束,并没有考虑对象点对之间的距离限制,因此并不能支持用户在空间约束方面细粒度的查询要求。
[0003]另一方面,在空间文本数据的研究中,距离往往是不可忽视的约束条件,而SKQ没法很好地捕捉距离约束条件从而返回更符合用户查询意图的结果,空间模式匹配(Spatial pattern matching,SPM)可以解决拥有距离约束的问题,SPM允许用户制定拥有多个关键字对象和不同对象之间的距离约束的空间模式作为查询输入,并返回数据库中所有满足空间模式约束的匹配实例[Fang,Y.,Cheng,R.,Cong,G.,Mamoulis,N.and Li,Y.,2018,April.On spatial pattern matching.In 2018IEEE 34th International Conference on Data Engineering(ICDE)(pp.293

304).IEEE.]。解决SPM问题的主要思想是基于R树的变体IR树(Inverted R

tree)的索引结构和多路连接操作。研究者提出了空间模式匹配算法MPJ(Multi

Pair

Join)及其改进算法MSJ(Multi

Star

Join)[Fang,Y.,Li,Y.,Cheng,R.,Mamoulis,N.and Cong,G.,2019.Evaluating pattern matching queries for spatial databases.The VLDB Journal,28(5),pp.649

673.]。MPJ和MSJ都基于PJ(Pair

Join)算法,PJ算法的主要思想是:由顶到下地在每层IR树节点寻找该层的匹配节点对,然后搜索这些匹配节点对的孩子节点,在其中找下一层的匹配节点对,重复向下搜索的操作,直到在IR树叶子节点层找到边的所有匹配。MPJ在获得所有需要的边以后,根据一定的连接顺序将所有孤立的边根据具有相同的端点进行连接以形成集合,最后形成结果点集作为返回结果。MSJ首先对用户提出的空间模式进行一定程度的改进(空间模式中的边存在距离范围,而部分端点因为同时与多个点连接会导致部分距离范围是冗余的),接着计算所有边的匹配节点数从而算出连接顺序,并采用星剪枝(如果空间文本对象周边的邻居个数小于空间模式中的匹配点的邻居个数可以直接修剪)的方式过滤不满足的边,最后根据连接顺序将各条边的匹配连接而得到匹配。以上研究的不足之处:解决SPM的MPJ和MSJ算法首先需要针对空间文本数据库建立静态的IR树索引,并且在该索引结构上进行搜索,因此动态变化的空间文本数据库会带来频繁的建索引操作,且在大规模的空间文本对象数据库中,仅仅拥有关键字和点对距离的约束,SPM可能会返回出很多结果。

技术实现思路

[0004]本专利技术的目的在于提供一种面向空间文本数据的空间结构匹配方法,可解决空间文本对象关系的过多冗余查询及需消耗一定磁盘空间建立索引的问题。具体为用户提出具体的空间结构样式,该空间结构样式包含了一定数量的空间对象,它们拥有不同的空间关键字,且任意两个空间对象点之间可能拥有一定距离和方向约束,在面向拥有海量的空间文本数据库中查询所有满足用户需求的具体对象点集。
[0005]为实现上述技术目的,本专利技术采用如下方案:
[0006]一种面向空间文本数据的空间结构匹配方法,包括:
[0007]S1构建由点边集合组成的连通图表征空间结构,点集中每个对象点赋予关键字属性,边集中每条边包含距离约束区间和方向约束区间,基于空间结构的距离约束区间确定空间结构中的最大距离d
max

[0008]S2根据空间结构中包含的关键字筛选空间文本数据库,将空间文本数据库中拥有点集中包含的关键字的对象点放入候选集合;所述空间文本数据库为记录所有对象点的信息的数据库,所述对象点的信息包含关键字;
[0009]S3筛选出候选集合中某一方向距离小于d
max
的点对;
[0010]S4基于空间结构中包含的关键字属性、距离约束区间和方向约束区间对S3中筛选出的点对进行复筛,获取满足条件的点对;
[0011]S5利用S4中筛出的点对构造无向图,并基于空间结构构建查本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向空间文本数据的空间结构匹配方法,其特征在于,包括:S1构建由点边集合组成的连通图表征空间结构,点集中每个对象点赋予关键字属性,边集中每条边包含距离约束区间和方向约束区间,基于空间结构的距离约束区间确定空间结构中的最大距离;S2根据空间结构中包含的关键字筛选空间文本数据库,将空间文本数据库中拥有点集中包含的关键字的对象点放入候选集合;所述空间文本数据库为记录所有对象点的信息的数据库,所述对象点的信息包含关键字;S3筛选出候选集合中某一方向距离小于的点对;S4基于空间结构中包含的关键字属性、距离约束区间和方向约束区间对S3中筛选出的点对进行复筛,获取满足条件的点对;S5利用S4中筛出的点对构造无向图,并基于空间结构构建查询用子图,通过子图匹配在S5构建的无向图中查找子图,完成空间结构匹配。2.根据权利要求1所述的方法,其特征在于,所述S3中,筛选出候选集合中垂向距离小于的点对,具体为:以各对象点为圆心、为直径构造对象点圆;将各对象点圆投影到轴,圆的上下界在轴产生投影,分析对象点圆的上界下界分布获取圆相交情况,确定相交的对象点圆对应的点对。3.根据权利要求2所述的方法,其特征在于,还包括:以空间文本数据库的所有对象点中横坐标值的最小值和最大值作为左边界和右边界,作为分区的跨度将空间文本数据库划分为若干个区域,为正整数;确定候选集合中各对象点所在的分区后,将各对象点圆投影到轴,圆的上下界在轴产生投影,分别分析各个分区中对象点圆的上界下界分布获取圆相交情况,获取各分区中相交的对象点圆对应的点对。4.根据权利要求2或3所述的方法,其特征在于...

【专利技术属性】
技术研发人员:刘志丹林维鑫伍楷舜
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1