基于空间编码的数据检索方法及装置制造方法及图纸

技术编号:19858036 阅读:20 留言:0更新日期:2018-12-22 11:49
本申请提供一种基于空间编码的数据检索方法及装置,涉及海量空间数据处理技术领域。该基于空间编码的数据检索方法包括:获取待检索的空间数据;采用空间数据编码算法将所述待检索的空间数据转换成待检索编码值;根据所述待检索编码值,计算检索行键;确定所述检索行键在预设非关系型数据库中对应的目标编码值位置;根据所述目标编码值位置,在所述预设非关系型数据库中读取目标编码值,获取所述目标编码值对应的空间数据。本申请通过空间编码算法将空间数据转换为编码值,利用编码值在非关系型数据库中构建空间索引,从而有效提高了空间数据的检索分析效率。

【技术实现步骤摘要】
基于空间编码的数据检索方法及装置
本专利技术涉及海量空间数据处理
,具体而言,涉及一种基于空间编码的数据检索方法及装置。
技术介绍
信息技术的快速发展,使得海量空间数据的存储和空间查询时效性面临巨大的挑战。大数据技术的日趋发展为海量空间数据的存储与查询提供解决思路。但现有的海量空间数据的研究大多停留在解决数据存储的层面上,在海量空间数据的查询及分析效率方面并不能较好的满足于生产需求。如何在现有的大数据存储方案的基础上解决空间数据的查询及分析效率的问题,是目前业界亟待解决的问题。现有技术中,非关系型数据库HBase在分布式存储及查询方面都有很好的表现。因此在一些行业应用场景中也会采用HBase用于空间数据的存储。由于HBase是面向列的数据库,传统的关系型数据库的空间索引方式很难应用于HBase中,这在很大程度上影响了空间数据的查询与分析效率。
技术实现思路
本专利技术的目的在于,针对上述现有技术中的不足,提供一种基于空间编码的数据检索方法及基于空间编码的数据检索装置,以解决在HBase中应用传统构建空间索引的方法进行空间数据检索时,检索效率低的问题,另外,也解决了HBase中数据量冗余问题。为实现上述目的,本专利技术实施例采用的技术方案如下:第一方面,本申请实施例提供了一种基于空间编码的数据检索方法,包括:获取待检索的空间数据;采用空间数据编码算法将待检索的空间数据转换成待检索编码值;根据待检索编码值,计算检索行键;确定检索行键在预设非关系型数据库中对应的目标编码值位置;根据目标编码值位置,在预设非关系型数据库中读取目标编码值,获取目标编码值对应的空间数据。进一步地,上述获取待检索的空间数据之前,还包括:获取待存储的空间数据集合,该空间数据集合包括:多个空间数据;采用空间数据编码算法将上述空间数据集合中每个空间数据转换成对应的待存储编码值;获取每个待存储编码值对应的行键;将待存储编码值以及上述行键,写入所述预设非关系型数据库中。进一步地,上述采用空间数据编码算法将空间数据集合中每个空间数据转换成对应的待存储编码值,包括:获取空间数据集合中每个空间数据对应的图形数据;计算每个图形数据的最小外接矩形,且根据预设编码规则获取每个所述图形数据对应的标识;依据该最小外接矩形的顶点坐标信息对图形数据进行递归编码,获取每个图形数据对应的待存储编码值。进一步地,上述计算获取每个待存储编码值对应的行键,包括:根据上述空间数据集合中空间数据量的大小,对预设非关系型数据库中的存储空间进行预分区,得到多个空间存储单元;根据每个空间存储单元的分区号、以及每个空间存储单元对应的待存储编码值,计算每个待存储编码值对应的行键。进一步地,上述确定检索行键在预设非关系型数据库中对应的目标编码值位置之前,还包括:根据检索行键,在所述预设非关系型数据库中获取与待检索编码值匹配的编码值集合;根据每个所述图形数据对应的标识,将与所述待检索空间数据匹配的编码值集合中,重复的图形数据进行滤除、保留其中的一份图形数据。第二方面,本申请实施例提供了一种基于空间编码的数据检索装置,该装置包括:获取模块,用于获取待检索的空间数据;计算模块,用于采用空间数据编码算法将待检索的空间数据转换成待检索编码值;根据待检索编码值,计算检索行键;匹配模块,用于确定检索行键在预设非关系型数据库中对应的目标编码值位置;确定模块,用于根据目标编码值位置,在预设非关系型数据库中读取目标编码值,获取目标编码值对应的空间数据。进一步地,还包括:存储模块;获取模块,还用于获取待存储的空间数据集合,空间数据集合包括:多个空间数据;计算模块,还用于采用空间数据编码算法将空间数据集合中每个空间数据转换成对应的待存储编码值;获取每个待存储编码值对应的行键;存储模块,用于将待存储编码值以及行键,写入预设非关系型数据库中。进一步地,计算模块,具体用于获取空间数据集合中每个空间数据对应的图形数据;计算每个图形数据的最小外接矩形,且根据预设编码规则获取每个图形数据对应的标识;依据最小外接矩形的顶点坐标信息对图形数据进行递归编码,获取每个图形数据对应的待存储编码值。进一步地,计算模块,具体用于根据空间数据集合中空间数据量的大小,对预设非关系型数据库中的存储空间进行预分区,得到多个空间存储单元;根据每个空间存储单元的分区号、以及每个空间存储单元对应的待存储编码值,计算每个待存储编码值对应的行键。进一步地,还包括去重模块,去重模块,用于根据检索行键,在预设非关系型数据库中获取与待检索编码值匹配的编码值集合;根据每个所述图形数据对应的标识,将与所述待检索空间数据匹配的编码值集合中,重复的图形数据进行滤除、保留其中的一份图形数据。本专利技术的有益效果是:通过空间编码算法将空间数据转换为编码值,利用编码值在非关系型数据库中构建空间索引,从而有效提高了空间数据的检索分析效率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的基于空间编码的数据检索方法流程示意图;图2为本申请实施例提供的基于空间编码构建空间索引方法流程示意图;图3为本申请实施例提供的基于空间编码进行数据编码方法流程示意图;图4为本申请实施例提供的空间编码方法原理示意图;图5为本申请实施例提供的HBase表预分区方法流程示意图;图6为本申请实施例提供的HBase预分区原理示意图;图7为本申请实施例提供的空间数据去重方法流程示意图一;图8为本申请实施例提供的空间数据去重方法流程示意图二;图9为本申请一实施例提供的基于空间编码的数据检索装置结构示意图;图10为本申请另一实施例提供的基于空间编码的数据检索装置结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。第一实施例图1为本申请实施例提供的基于空间编码的数据检索方法流程示意图,该方法可以由计算机、或服务器等设备执行,但不具体限制。如图1所示,该基于空间编码的数据检索方法包括:S101、获取待检索的空间数据。可以是用户通过检索界面输入待检索的空间数据。S102、采用空间数据编码算法将待检索的空间数据转换成待检索编码值。可选地,本实施例采用四分编码方式对空间矢量数据进行编码,通过四分编码能够方便快速的获取图形数据中点状数据、线状数据及面状数据的编码值,同时,编码值的长度也可根据实际情况进行调整。S103、根据待检索编码值,计算检索行键。S104、确定检索行键在预设非关系型数据库中对应的目标编码值位置。需要说明的是,本申请实施例中所述的预设非关系型数据库可以为HBase数据库,待检索的编码值与检索行键是一一对应关系。HBase作为一种面向列的分布式数据库,通过在HBase中创建检索行键,以该检索行键为索引,能实现空间数据的快速检索,且准确率较高,而无需通过对HBase中的每一个数据进行遍历来进行数据检索,浪费时间且效本文档来自技高网...

【技术保护点】
1.一种基于空间编码的数据检索方法,其特征在于,包括:获取待检索的空间数据;采用空间数据编码算法将所述待检索的空间数据转换成待检索编码值;根据所述待检索编码值,计算检索行键;确定所述检索行键在预设非关系型数据库中对应的目标编码值位置;根据所述目标编码值位置,在所述预设非关系型数据库中读取目标编码值,获取所述目标编码值对应的空间数据。

【技术特征摘要】
1.一种基于空间编码的数据检索方法,其特征在于,包括:获取待检索的空间数据;采用空间数据编码算法将所述待检索的空间数据转换成待检索编码值;根据所述待检索编码值,计算检索行键;确定所述检索行键在预设非关系型数据库中对应的目标编码值位置;根据所述目标编码值位置,在所述预设非关系型数据库中读取目标编码值,获取所述目标编码值对应的空间数据。2.根据权利要求1所述的方法,其特征在于,所述获取待检索的空间数据之前,还包括:获取待存储的空间数据集合,所述空间数据集合包括:多个空间数据;采用空间数据编码算法将所述空间数据集合中每个所述空间数据转换成对应的待存储编码值;获取每个所述待存储编码值对应的行键;将所述待存储编码值以及所述行键,写入所述预设非关系型数据库中。3.根据权利要求2所述的方法,其特征在于,所述采用空间数据编码算法将所述空间数据集合中每个所述空间数据转换成对应的待存储编码值,包括:获取所述空间数据集合中每个所述空间数据对应的图形数据;计算每个所述图形数据的最小外接矩形,且根据预设编码规则获取每个图形数据对应的标识;依据所述最小外接矩形的顶点坐标信息对所述图形数据进行递归编码,获取每个所述图形数据对应的待存储编码值。4.根据权利要求2所述的方法,其特征在于,所述计算获取每个所述待存储编码值对应的行键,包括:根据所述空间数据集合中空间数据量的大小,对所述预设非关系型数据库中的存储空间进行预分区,得到多个空间存储单元;根据每个所述空间存储单元的分区号、以及每个所述空间存储单元对应的所述待存储编码值,计算每个所述待存储编码值对应的行键。5.根据权利要求3所述的方法,其特征在于,所述确定所述检索行键在预设非关系型数据库中对应的目标编码值位置之前,还包括:根据所述检索行键,在所述预设非关系型数据库中获取与所述待检索编码值匹配的编码值集合;根据每个所述图形数据对应的标识,将与所述待检索空间数据匹配的编码值集合中,重复的图形数据进行滤除、保留其中的一份图形数据。6...

【专利技术属性】
技术研发人员:栗国保黄慧敏梁亮亮田杰李静陈光富付海涛杨文伟廖家宝
申请(专利权)人:广东南方数码科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1