一种基于密度分布的地理空间数据集样例查询方法技术

技术编号:41205989 阅读:24 留言:0更新日期:2024-05-07 22:32
本发明专利技术属于数据检索领域,公开了一种基于密度分布的地理空间数据集样例查询方法,包括:数据处理:对空间数据集进行处理,通过空间网格划分,统计位置点在网格内的密度分布并获取密度分布元素集,然后生成最小覆盖矩形;查询执行:根据查询样例数据集,生成密度分布元素集和最小覆盖矩形,查询时首先根据样例数据集与每个数据集的最小覆盖矩形的重叠区域大小,筛选出一部分候选数据集,然后,根据密度分布元素集计算候选数据集与查询样例数据集的相似度,并选取相似度最高的k个数据集作为查询结果。本发明专利技术将空间数据集转化为密度分布表示,以时空数据集之间在重叠网格内的位置点分布比例作为相似度衡量依据,提高了查询效率。

【技术实现步骤摘要】

本专利技术属于数据检索领域,具体的说是涉及一种高效的基于密度分布的空间数据集样例查询方法。


技术介绍

1、作为真实世界中数据集的重要组成部分,空间数据集在世界范围内的应用越来越广泛,如何有效的获取自己所需的空间数据集,即空间数据集搜索,有迫切的现实需求。

2、空间数据集的样例查询需要进行数据集之间的相似度度量,为了实现空间数据集的相似度度量,现有的文献已经提出了多种方法。例如emd衡量了一个分布转化为另一个分布的最小成本,通过将空间数据集分布化表示并计算emd来进行相似度度量;mbr根据空间数据集的mbr的重叠区域面积大小来计算相似度。在已经提出的空间相似度度量方法中,emd的时间复杂度较高,对结果存在较大影响;mbr无法有效度量两个数据集几乎处在相同的空间范围,位置点的分布几乎没有相似性的情况,即没有考虑数据在空间中的分布。

3、中国专利申请zl 2023115515813公开了一种高效的基于密度灰度图的空间数据集查询方法,但这个方法是将空间数据集转化为灰度图像表示并采用了图像领域的相似度计算方法,具有较高的存储代价以及计算开销,本文档来自技高网...

【技术保护点】

1.一种基于密度分布的地理空间数据集样例查询方法,其特征在于:一个地理空间数据集样例查询是在地理空间数据集D中获取与查询样例地理空间数据集De最相似的k个空间数据集的查询操作,地理空间数据集D={D1,D2,…,Dn},其中Di为包含若干二维空间位置点的地理空间数据集,具体包括数据预处理阶段和数据集样例查询阶段:

2.根据权利要求1所述的一种基于密度分布的地理空间数据集样例查询方法,其特征在于:所述步骤12中根据每个二维空间位置点的地理空间数据集Di中各二维空间位置点在各网格的ID集合G中各网格内的密度和分布情况,计算每个二维空间位置点的地理空间数据集Di的密度分布元素集Ti...

【技术特征摘要】

1.一种基于密度分布的地理空间数据集样例查询方法,其特征在于:一个地理空间数据集样例查询是在地理空间数据集d中获取与查询样例地理空间数据集de最相似的k个空间数据集的查询操作,地理空间数据集d={d1,d2,…,dn},其中di为包含若干二维空间位置点的地理空间数据集,具体包括数据预处理阶段和数据集样例查询阶段:

2.根据权利要求1所述的一种基于密度分布的地理空间数据集样例查询方法,其特征在于:所述步骤12中根据每个二维空间位置点的地理空间数据集di中各二维空间位置点在各网格的id集合g中各网格内的密度和分布情况,计算每个二维空间位置点的地理空间数据集di的密度分布元素集ti的过程包括如下步骤:

3.根据权利要求1所述的一种基于密度分布的地理空间数据集样例查询方法,其特征在于:所述步骤13中,计算能够覆盖二维空间位置点的地理空间数据集di中各二维空间位置点的最小覆盖矩形ri=(plb,pru)的过程如下:设数据集二维空间位置点的地理空间数据集di中包含t个二维空间位置点,记为di={l1,l2,…,lt},lj.x和lj.y分别表示二维空间位置点lj的横坐标和纵坐标,则最小覆盖矩形ri的左下角plb和右上角pru的位置坐标的计算方法如下:

4.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员:孙杰戴华李鹏越张明月蒋明峰杨庚
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1