基于网格R树混合索引构建方法、检索方法和装置制造方法及图纸

技术编号:38020959 阅读:13 留言:0更新日期:2023-06-30 10:47
本发明专利技术公开了一种基于网格R树混合索引构建方法,其包括:S1:利用网格初始化参数初始化网格混合索引数据结构;S2:生成全局网格索引分区映射文件,并在所述全局网格索引分区映射文件中存储记录每个地物要素的地物要素顺序编号和地物要素唯一编号;S3:生成地物要素存储文件,并在所述地物要素存储文件中存储记录每个地物要素的地物要素信息;S4:判断地物要素是否为复杂几何对象,并采用三角剖分算法将地物要素的复杂几何对象拆分成若干个地物要素剖分三角形;S5:结合地物要素和/或地物要素剖分三角形的最小外接矩形及网格初始化参数计算获得地物要素的网格分区集合;S6:遍历所述地物要素的网格分区集合,为每个网格分区对应建立R树索引。应建立R树索引。应建立R树索引。

【技术实现步骤摘要】
基于网格R树混合索引构建方法、检索方法和装置


[0001]本专利技术涉及信息
,具体涉及一种基于网格R树混合索引构建方法、检索方法和装置。

技术介绍

[0002]近年来,随着地理信息系统在电力行业、交通运输、气象预警、水文监测、车辆物流、防灾减灾、农林渔业、公共安全等领域得到广泛应用,空间数据信息的价值在各行各业体现尤为明显,针对日积月累的空间大数据的统一存储、集中管理、高效访问成为了研究地理信息系统的关键处理技术。
[0003]当前,由于空间数据信息的数据量规模庞大,且这些空间数据信息具有多样性和复杂性,因而在实际运用过程中对于空间数据的查询性能要求极高,并将空间查询性能作为衡量空间数据操作的重要指标。
[0004]需要指出的是,空间数据查询技术主要是构建各类空间索引,以实现空间数据查询操作,从而满足空间数据高性能访问要求。其中,空间索引主要包括:网格索引、KD树索引、四叉树索引、R树索引等类型。
[0005]然而,专利技术人研究发现,传统空间索引主要采用单一性内存索引结构进行空间数据管理,其只能满足数据量规模较小的空间数据访问,且空间索引数据结构全量加载到内存中,这种技术手段的内存开销较大,构建索引速度慢,查询效率低,实际应用效果不佳。
[0006]由此,当前传统的空间索引手段存在以下几个缺点:
[0007](1)传统单一内存空间索引仅支持数据规模较小的空间数据。
[0008](2)传统单一内存空间索引查询效率低。空间数据检索效率作为空间索引的重要指标,由于大规模多样化无规则空间矢量数据,空间分布没有规律,采用单一二维树索引结构,将会导致索引树高度变高,空间数据检索代价较大,查询变慢。
[0009](3)传统单一内存空间索引,将空间矢量数据全量加载到内存中,对内存开销较大。
[0010](4)传统单一内存空间索引顺序构建速度慢,其采用R树、四叉树、KD树索引等二维树索引结构,构建大规模空间数据速度慢,难于进行并行化构建。
[0011](5)复杂几何对象构成的点集合总数比较大,一般达到几万个点数甚至更多,采用传统单一内存空间索引对复杂几何对象精确空间几何关系判断需要消耗较多cpu运算时间。

技术实现思路

[0012]为了克服上述现有技术的缺陷,本专利技术所要解决的技术问题是:提供一种基于网格R树混合索引构建方法、检索方法和装置,该方案设计简单,其通过采用混合索引构建方式,可以支持超大规模的空间矢量数据索引构建,同时对复杂几何对象进行了三角剖分优化构建流程,以在降低内存使用开销同时,提升数据检索性能,并能够根据检索范围进行高
效空间数据检索。
[0013]为了解决上述技术问题,本专利技术采用的第一个技术方案为:一种基于网格R树混合索引构建方法,其包括步骤:
[0014]S1:利用网格初始化参数初始化网格混合索引数据结构;
[0015]S2:生成全局网格索引分区映射文件,并在所述全局网格索引分区映射文件中存储记录每个地物要素的地物要素顺序编号和地物要素唯一编号;
[0016]S3:生成地物要素存储文件,并在所述地物要素存储文件中存储记录每个地物要素的地物要素信息;
[0017]S4:对每个地物要素的地物要素信息中的几何范围参数、构成点数、构成的多面孔洞个数进行分析判断,若所述几何范围参数、构成点数、构成的多面孔洞个数超过设定阈值,则判断该地物要素为复杂几何对象,并采用三角剖分算法将该地物要素的复杂几何对象拆分成若干个地物要素剖分三角形;
[0018]S5:结合地物要素和/或地物要素剖分三角形的最小外接矩形及所述网格初始化参数计算获得地物要素的网格分区集合;
[0019]S6:遍历所述地物要素的网格分区集合,为每个网格分区对应建立R树索引。
[0020]在本专利技术所设计的这种基于网格R树混合索引构建方法中,采用分而治之的思路进行存储优化,通过将超大规模的空间矢量数据按照网格一级索引分区,每个分区对应一个存储文件,以使每个分区文件对应一棵R树索引。本专利技术创造性地将网格索引与R树索引结合,有效发挥两个索引的优点,混合索引优势互补。其中,在分区后的R树索引降低了只有唯一R树的树高度,减小了查询矩形范围与更多层次的节点矩形范围进行几何相交判断,从而提高查询效率。
[0021]此外,在本专利技术中,通过将复杂几何对象进行三角剖分,能够将复杂几何对象化解为若干简化的地物要素剖分三角形,以提高复杂对象精确化几何运算效率,提高查询效率,降低cpu资源使用率。
[0022]将本专利技术所设计的技术方案与传统空间索引采用单一内存索引结构进行空间数据管理的技术方案进行对比不难看出:
[0023](1)传统单一内存空间索引仅支持数据规模较小的空间数据。而本专利技术所提出的这种基于网格R树混合索引方案,能够将海量数据先通过网格进行分区,再在每个分区上对应独立构建一棵R树索引,以此满足海量空间矢量数据的存储组织管理。
[0024](2)传统单一内存空间索引查询效率低。而本专利技术提出的这种基于网格R树混合索引方案,通过网格划分出多棵R树索引,以使得每棵R树的索引矩形范围控制在一定的范围,减小了单棵树的几何对象数据量,降低了树高度,其在检索查询时的树路径较小,可快速获得查询结果集,从而提高检索查询效率。
[0025](3)传统单一内存空间索引,将空间矢量数据全量加载到内存中,对内存开销较大。而本专利技术提出的这种基于网格R树混合索引方案,首先将海量空间矢量数据进行分区管理,减小每个分区的空间数据量,同时构建一棵基于磁盘的R树索引,以支持按需从磁盘中访问相关空间数据。
[0026](4)传统单一内存空间索引顺序构建速度慢。而本专利技术提出的这种基于网格R树混合索引方案,采用一级网格索引进行分区,将数据规模划小,并且每个网格二级索引都相互
独立,可开展独立索引构建,其易于实现并行化多棵树索引结构同时构建,能够有效缩短整体空间索引构建时间。
[0027](5)传统内存空间索引针对复杂几何对象的查询精确化几何关系运算耗时。而本专利技术提出的这种基于网格R树混合索引方案,特地针对复杂几何对象进行了索引构建处理,其将复杂对象进行三角剖分处理,然后再构建索引。当精确匹配时,由于复杂对象由若干个简单的地物要素剖分三角形组成,在大部分情况下查询范围只需要跟剖分几何对象进行精细化匹配,其能够有效提高查询效率,并减少cpu的运算消耗。
[0028]进一步的,在本专利技术所述的基于网格R树混合索引构建方法中,在步骤S6中,为每个网格分区对应建立R树索引,具体包括如下步骤:
[0029]S61:初始化R树索引,创建R树索引文件,并设定R树节点的最大节点数量N;
[0030]S62:在插入R树索引文件时,首先从根节点出发选择地物要素索引项插入的合适路径,将地物要素的最小外接矩形与每个节点的矩形范围进行几何关系运算,找出一条从根节点到叶子节点的插入路径;
[0031]S63:将所述地物要素索引项以追加的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于网格R树混合索引构建方法,其特征在于,包括步骤:S1:利用网格初始化参数初始化网格混合索引数据结构;S2:生成全局网格索引分区映射文件,并在所述全局网格索引分区映射文件中存储记录每个地物要素的地物要素顺序编号和地物要素唯一编号;S3:生成地物要素存储文件,并在所述地物要素存储文件中存储记录每个地物要素的地物要素信息;S4:对每个地物要素的地物要素信息中的几何范围参数、构成点数、构成的多面孔洞个数进行分析判断,若所述几何范围参数、构成点数、构成的多面孔洞个数超过设定阈值,则判断该地物要素为复杂几何对象,并采用三角剖分算法将该地物要素的复杂几何对象拆分成若干个地物要素剖分三角形;S5:结合地物要素和/或地物要素剖分三角形的最小外接矩形及所述网格初始化参数计算获得地物要素的网格分区集合;S6:遍历所述地物要素的网格分区集合,为每个网格分区对应建立R树索引。2.根据权利要求1所述的基于网格R树混合索引构建方法,其特征在于,在步骤S6中,为每个网格分区对应建立R树索引,具体包括如下步骤:S61:初始化R树索引,创建R树索引文件,并设定R树节点的最大节点数量N;S62:在插入R树索引文件时,首先从根节点出发选择地物要素索引项插入的合适路径,将地物要素的最小外接矩形与每个节点的矩形范围进行几何关系运算,找出一条从根节点到叶子节点的插入路径;S63:将所述地物要素索引项以追加的方式插入到所述插入路径的叶子节点;S64:若所述叶子节点的节点数量已满,即超过了R树节点的最大节点数量N,则该叶子节点将分裂为两个节点,整个过程自底向上沿着所述插入路径由叶子节点向根节点传播;若根节点进行分裂,则整棵R树索引将增加一层。3.根据权利要求1所述的基于网格R树混合索引构建方法,其特征在于,在步骤S1中,根据网格最小经度grid_minx、网格最小纬度grid_miny、网格最大经度grid_maxx、网格最大纬度grid_maxy、网格大小grid_cellsize、网格行数grid_rows、网格列数grid_columns初始化网格混合索引数据结构。4.根据权利要求1所述的基于网格R树混合索引构建方法,其特征在于,在步骤S2中,所述地物要素顺序编号在地物要素索引构建时按照整数序列号从1开始依次递增生成,所述地物要素唯一编号为地物要素唯一标识的字符串。5.根据权利要求1所述的基于网格R树混合索引构建方法,其特征在于,在步骤S3中,所述地物要素信息包括地物要素空间属性信息和地物要素实体属性信息,所述地物要素空间属性信息包括地物要素几何对象形状,所述地物要素实体属性信息包括地物要素唯一编号标识、地物要素名称。6.一种基于网格R树混合索引检索方法,所述网格R树混合索引是根据如权利要求1

5任一项所述的基于网格R树混合索引构建方法构建,其特征在于,包括步骤:100:根据输入几何对象形状,计算所述几何对象的最小外接矩形作为空间数据的查询矩形范围;200:结合网格初始化参数计算所述查询矩形范围所在网格分区集合;
300:遍历所述网格分区集合,并加载对应网格分区的R树索引,根据所述查询矩形范围并行对所述对应网格分区的R树索引开展空间检索操作,以收集每个R树索引的结果集,并去除结果集中重复的地物要素顺序编号,合并成候选地物要素编号结果集;400:遍历候选地物要素编号结果集,从全...

【专利技术属性】
技术研发人员:黄东海王佩光林黎鸣苏簪铀陈建敏黄斯文
申请(专利权)人:国网信息通信产业集团有限公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1