一种基于图网络层次划分的地理知识关联索引与检索方法技术

技术编号:39066684 阅读:16 留言:0更新日期:2023-10-12 19:59
本发明专利技术涉及信息检索技术领域,具体来说为一种基于图网络层次划分的地理知识关联索引与检索方法,通过全面解析地理知识的关联关系,从对象关系视角出发构建地理知识关联索引方法。通过分析基于对象关系视角的地理知识的查询需求,根据索引结构设计相应的关联查询算法,使其能够有效地满足不同类型的关联查询。有效解决当前地理知识访问中存在的问题,新型的地理知识关联索引方法,能够为后续的场景数据调度、地理计算和复杂地理分析应用等方面奠定坚实基础。定坚实基础。定坚实基础。

【技术实现步骤摘要】
一种基于图网络层次划分的地理知识关联索引与检索方法


[0001]本专利技术涉及信息检索
,具体来说为一种基于图网络层次划分的地理知识关联索引与检索方法。

技术介绍

[0002]在地理场景中,不同的地理对象之间存在着不同类型的相互作用关系,比如社交网络、交通网络等,这些相互作用关系将原本相对独立的对象关联起来,组成复杂的巨系统,推动着城市的发展与进步。在地理场景中,空间相互作用是地理场景要素中其它一些相互作用关系的基础,是描述存在于城市空间中的物体之间的空间位置特征下的联系。除空间关联关系之外,其它关联关系也是普遍存在的,比如城市中人、车、物、信息、能量和传染病毒等位置变化,这些空间位置上的移动暗示着各种不同的关联关系共同作用的结果,描述地理对象之间存在的各种相互作用关系,感知和理解这些相互作用能够帮助人类更好地掌握自然界和社会中的发展规律,从而对很多领域(如人口学、交通、城市规划和流行病学等)产生极大的推动作用。例如,在应对传染疾病时,有效且高效地掌握人类移动过程中所关联的人与物,可以帮助准确地发现病毒的传播途径,进而可以帮助人们控制传染病和制定一些重要政策。
[0003]地理场景中的地理对象间存在着各种各样的相互作用关系,空间关系仅仅是众多关系中的一种,其中很多对象间的关系无法通过空间关系判断获得,这里包含场景与场景间的关系、场景与要素间的关系、以及要素与要素之间的关系。地理数据关联索引方法大致可以分为:基于关系模型和基于图模型的索引方法。基于关系模型方法的主要思想是将不同类型的数据分别放入不同的表中,然后建立起它们之间的关系;在查询过程中,通过多次连接操作获取数据之间的关系。当数据规模较小且关系相对简单时,这种方法的效率能够得到有效的保证,但其难以适用于当今规模巨大且关系复杂的地理数据的查询需求。基于图模型的索引方法,主要通过将关联数据抽象为图结构中的顶点和关联边进行组织;其查询过程主要是基于关联边依次遍历查找到有效对象。当查询对象涉及的范围较小时,这种类型的方法具有较好的效率;但当查询需要涉及到较大的范围时,其性能急剧下降,难以满足实际应用需求。如何基于对象关系视角对城市场景数据进行高效地访问仍然未得到解决,因此亟需一种有效的城市场景数据的关联索引和查询方法。
[0004]基于以上原因,本专利技术设计了一种基于图网络层次划分的地理知识关联索引与检索方法,通过全面解析地理知识的关联关系,从对象关系视角出发构建地理知识关联索引方法。通过分析基于对象关系视角的地理知识的查询需求,根据索引结构设计相应的关联查询算法,使其能够有效地满足不同类型的关联查询。有效解决当前地理知识访问中存在的问题,新型的地理知识关联索引方法,能够为后续的场景数据调度、地理计算和复杂地理分析应用等方面奠定坚实基础。

技术实现思路

[0005]本专利技术目的为通过克服现有技术的不足,提供一种基于图网络层次划分的地理知识关联索引与检索方法,通过全面解析地理知识的关联关系,从对象关系视角出发构建地理知识关联索引方法。通过分析基于对象关系视角的地理知识的查询需求,根据索引结构设计相应的关联查询算法,使其能够有效地满足不同类型的关联查询。有效解决当前地理知识访问中存在的问题,新型的地理知识关联索引方法,能够为后续的场景数据调度、地理计算和复杂地理分析应用等方面奠定坚实基础。
[0006]为了达到上述目的,本专利技术提供一种基于图网络层次划分的地理知识关联索引与检索方法,包括如下步骤:
[0007]S1、将地理知识的关联关系特征进行探测与提取,并构架相应的关联关系图,并对其进行相应的定义GSD=<X,F,A,R,S>;
[0008]S2、对关联关系图进行层次划分;
[0009]S3、基于图网络的层次划分结果,构建关联数据的AG

tree索引结构;
[0010]S4、将地理知识数据对象插入索引结构;
[0011]S5、基于AG

tree索引结构,实现地理知识的关联阶数查询;
[0012]S6、基于AG

tree索引结构,实现地理知识的关联范围查询;
[0013]S7、基于AG

tree索引结构,实现地理知识的复杂关联关系查询。
[0014]步骤S2具体包括如下步骤:
[0015]S21、用多次k路划分算法将图网络划分成k个顶点总和近似相等的划分子网络,k为自然数;
[0016]S22、给定一个图网络G,叶子分区所包含的顶点数量不超过β个作为终止条件;
[0017]S23、将G分解为几个顶点相当的子图,并将每个子图添加到一个列表HP即层次划分结果集中;
[0018]S24、当层次划分结果集中的任何底层子图包含超过β个顶点时,将S23步骤递归地应用于子图,直到结果满足终止条件;
[0019]S25、在层次划分过程中,划分的准则是在保证各个分区内顶点数量相对均衡的情况下,边割的关联边数量最小。
[0020]步骤S3具体包括如下步骤:
[0021]S31、根节点对应为整个关联图G,为一个单叶节点,它最初不包含任何其它树节点;
[0022]S32、G的子图成为根的子节点,根节点变成一个非叶节点,并且每个子图对应AG树的一个树节点,树节点之间的关系等于子图之间的相应关系,没有子图的子图是叶节点,并识别每个叶节点的堂兄弟节点;
[0023]S33、对于每个树节点,其连接点和联合连接点被识别并添加到相应的树节点中;
[0024]S34、计算从叶节点到根节点的关联阶数矩阵,叶子结点的堂兄弟节点之间的关联阶数矩阵,具体包括如下步骤:
[0025]两个顶点在同一叶子节点中:给定两个顶点vi和vj在同一个叶子节点内,包含不同类型顶点的最短关联阶数有两种情况:
[0026](1)当SPDis(vi,vj)包含的所有顶点在同一个叶子节点时,直接使用Dijkstra算
法能够有效地计算最短关联阶数;
[0027](2)SPDis(vi,vj)包含一些顶点在其它叶子顶点中,因此SPDis(vi,
[0028]vj)应该至少包含两个leaf(vi)的两个桥接点,用
[0029]BridgeDist(vi,vj)表示vi和vj最短关联阶数包含外部顶点,因此BridgeDist(vi,vj)可以通过下式1计算:
[0030][0031]根据以上情况,能够得到两个顶点在同一叶子节点中的最短关联阶数计算下式2计算:
[0032]SPDis(v
i
,v
j
)=min(BridgeDist(v
i
,v
j
),Dijkstra(v
i
,v
j
))
[0033]两个顶点在不同叶子节点中:给定两个顶点vi和vj在不同叶子节点内,vi∈leaf(vi),vj∈leaf(vj),需要确定其叶本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图网络层次划分的地理知识关联索引与检索方法,其特征在于,包括如下步骤:S1、将地理知识的关联关系特征进行探测与提取,并构架相应的关联关系图,并对其进行相应的定义GSD=<X,F,A,R,S>;S2、对关联关系图进行层次划分;S3、基于图网络的层次划分结果,构建关联数据的AG

tree索引结构;S4、将地理知识数据对象插入所述索引结构;S5、基于AG

tree索引结构,实现地理知识的关联阶数查询;S6、基于AG

tree索引结构,实现地理知识的关联范围查询;S7、基于AG

tree索引结构,实现地理知识的复杂关联关系查询。2.根据权利要求1所述基于图网络层次划分的地理知识关联索引与检索方法,其特征在于,所述步骤S2具体包括如下步骤:S21、用多次k路划分算法将图网络划分成k个顶点总和近似相等的划分子网络,k为自然数;S22、给定一个图网络G,叶子分区所包含的顶点数量不超过β个作为终止条件;S23、将G分解为几个顶点相当的子图,并将每个子图添加到一个列表HP即层次划分结果集中;S24、当层次划分结果集中的任何底层子图包含超过β个顶点时,将S23步骤递归地应用于子图,直到结果满足终止条件;S25、在层次划分过程中,划分的准则是在保证各个分区内顶点数量相对均衡的情况下,边割的关联边数量最小。3.根据权利要求1所述基于图网络层次划分的地理知识关联索引与检索方法,其特征在于,所述步骤S3具体包括如下步骤:S31、根节点对应为整个关联图G,为一个单叶节点,它最初不包含任何其它树节点;S32、G的子图成为根的子节点,根节点变成一个非叶节点,并且每个子图对应AG树的一个树节点,树节点之间的关系等于子图之间的相应关系,没有子图的子图是叶节点,并识别每个叶节点的堂兄弟节点;S33、对于每个树节点,其连接点和联合连接点被识别并添加到相应的树节点中;S34、计算从叶节点到根节点的关联阶数矩阵,叶子结点的堂兄弟节点之间的关联阶数矩阵,具体包括如下步骤:两个顶点在同一叶子节点中:给定两个顶点vi和vj在同一个叶子节点内,包含不同类型顶点的最短关联阶数有两种情况:(1)当SPDis(vi,vj)包含的所有顶点在同一个叶子节点时,直接使用Dijkstra算法能够有效地计算最短关联阶数;(2)SPDis(vi,vj)包含一些顶点在其它叶子顶点中,因此SPDis(vi,vj)应该至少包含两个leaf(vi)的两个桥接点,用BridgeDist(vi,vj)表示vi和vj最短关联阶数包含外部顶点,因此BridgeDist(vi,vj)可以通过下式1计算:
根据以上情况,能够得到两个顶点在同一叶子节点中的最短关联阶数计算下式2计算:SPDis(v
i
,v
j
)=min(BridgeDist(v
i
,v
j
),Dijkstra(v
i
,v
j
))两个顶点在不同叶子节点中:给定两个顶点vi和vj在不同叶子节点内,vi∈leaf(vi),vj∈leaf(vj),需要确定其叶节点的最低共同祖先,为了易于表达,用LCA(vi,vj)表示leaf(vi)和leaf(vj)最低公共祖先;当两个叶子节点是兄弟节点时,桥接点B(leaf(vi))和顶点vi的最短关联阶数是已知的,此外,leaf(vi)的父节点的距离矩阵中存储了联合桥接点之间的距离;因此最短关联阶数能够通过下式3计算:当b1和b2是同一顶点时,SPDis(b1,b2)=0;对于叶节点,距离矩阵包含了顶点与桥接点之间的距离,对于非叶节点,拥有了联合桥接点之间...

【专利技术属性】
技术研发人员:王曙闵祥强诸云强
申请(专利权)人:中国科学院地理科学与资源研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1