一种空间点数据的处理方法及装置制造方法及图纸

技术编号:15329565 阅读:62 留言:0更新日期:2017-05-16 13:12
本发明专利技术公开了一种空间点数据的处理方法及装置,用以通过静态划分网格编号的方式存储空间点的数据,从而提高数据存储效率,适用于海量数据存储。本发明专利技术提供的一种空间点数据的处理方法,包括:根据已知空间点的坐标所处的范围,确定网格范围,并根据已知空间点的数量,确定网格级别,根据所述网格范围和网格级别生成网格系统,该网格系统中包括多个网格;针对每一已知空间点的坐标,根据该已知空间点的坐标,确定在所述网格系统中该已知空间点对应的网格编号;将每一已知空间点的数据存储到在所述网格系统中对应的网格编号的网格中。

Method and device for processing spatial point data

The invention discloses a processing method and device of spatial data, by way of static mesh number storage space of data points, so as to improve the efficiency of data storage, suitable for mass data storage. Including the processing method, a spatial data provided by the invention: according to the range of known coordinates of space points which determine the grid range, and according to the known number of space points, determine the grid level, according to the grid and grid level grid generation system, the grid system comprises a plurality of grid coordinates; for each known space points, according to the known coordinates of the spatial points, defined in the grid system corresponding to the known space point grid number; every known space point data to the grid number in the corresponding grid system in.

【技术实现步骤摘要】
一种空间点数据的处理方法及装置
本专利技术涉及数据处理
,尤其涉及一种空间点数据的处理方法及装置。
技术介绍
随着人类活动能够产生和捕捉到的数据量逐年膨胀,人类进入了大数据时代。这种以包含经纬度字段为特征的坐标点数据,例如GPS数据,静态地理位置元素坐标点数据等,数据种类和量也得到了前所未有的增长。以全国的建筑物、场所等的坐标点数据为例,可能就达到数亿条。面对如此海量的数据,传统的关系型数据库,即使建立经纬度坐标的联合索引,其空间范围查询响应时间有时也会达到数十秒;而新出现的诸多NoSQL库,虽然解决了普通海量属性数据访问性能的问题,但是对于这种空间数据,由于其中对大多对SQL并不支持,如果无法正确的建立索引表,空间范围查询时,也会面临数据扫描范围过大、功能单一、无法分页等问题。现有技术中基于Key/Value型NoSQL数据库的矢量数据先序四叉树编码和索引方法包括:涉及一种基于Key/Value型NoSQL数据库的矢量数据先序四叉树编码和索引方法,这种方法使数据物理存储次序与空间范围连续性一致、数据主键次序与物理存储次序一致,从而在空间查询时能减少I/O操作,提高查询效率。这种方法包括如下步骤:完全四叉树空间划分与先序四叉树结点编码;矢量数据前缀编码和索引构建;先序四叉树索引。但是,现有技术利用四叉树存储点数据的方案都是一种“自上而下”的方式,即随着点数据的写入,动态的划分网格,不同的网格位于不同的级别。这样做的缺点是:针对范围查询一次性取出全部数据的情况,难以将多次的随机读转换为少量次数的连续读,在查询范围较大时,性能会相当的低;写入空间点数据时,由于网格动态划分的存在,会随时修改已有的数据,会导致性能较低,在分布式的情况下,还需要额外开销保证其一致性;翻页时采取随机网格的方式,难以保证翻页的稳定性。针对每次只需要取出少量数据的情况,如果按照原有的方法对取出的数据直接进行分页,可能产生如下两个不良后果:一、假定在数据量过大的情况下,一次将数据全部取出,再在客端分页的方式,可能导致内存溢出;二、如果使用数据库的限制取出前n条数据的方式,由于数据是按照网格编号存储的,导致的结果是,当查询范围较大时,每一页取出的数据条目均是集中在一个很小范围内的点,这对于地图撒点而言是不可接受的。综上所述,现有技术中根据空间点的数量,动态划分网格,因此导致数据存储效率较低,不适用于海量数据存储。
技术实现思路
本专利技术实施例提供了一种空间点数据的处理方法及装置,用以通过静态划分网格编号的方式存储空间点的数据,从而提高数据存储效率,适用于海量数据存储。本专利技术实施例提供的一种空间点数据的处理方法,包括:根据已知空间点的坐标所处的范围,确定网格范围,并根据已知空间点的数量,确定网格级别,根据所述网格范围和网格级别生成网格系统,该网格系统中包括多个网格;针对每一已知空间点的坐标,根据该已知空间点的坐标,确定在所述网格系统中该已知空间点对应的网格编号;将每一已知空间点的数据存储到在所述网格系统中对应的网格编号的网格中。通过该方法,根据已知空间点的坐标所处的范围,确定网格范围,并根据已知空间点的数量,确定网格级别,根据所述网格范围和网格级别生成网格系统,该网格系统中包括多个网格;针对每一已知空间点的坐标,根据该已知空间点的坐标,确定在所述网格系统中该已知空间点对应的网格编号;将每一已知空间点的数据存储到在所述网格系统中对应的网格编号的网格中,因此实现了通过静态划分网格编号的方式存储空间点的数据,从而提高了数据存储效率,适用于海量数据存储。较佳地,该方法还包括:根据查询范围,确定在所述网格系统中需要查询的网格;对所述需要查询的网格中存储的空间点的数据进行查询,确定查询结果。较佳地,根据查询范围,确定在所述网格系统中需要查询的网格,具体包括:根据查询范围,确定在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格;对所述需要查询的网格中存储的空间点的数据进行查询,确定查询结果,具体包括:将在所述网格系统中该查询范围完全覆盖的网格内存储的空间点的数据作为查询结果;以及,对于在所述网格系统中与该查询范围相交的网格内存储的空间点的数据,滤除不属于所述查询范围的空间点的数据,将剩余的空间点的数据作为查询结果。较佳地,所述根据查询范围,确定在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格之前,该方法还包括:根据查询范围的大小,将所述网格系统的级别进行简化,使得所述网格系统中的网络数量减少;所述根据查询范围,确定在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格,具体包括:根据查询范围,确定在简化后的网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格;所述将在所述网格系统中该查询范围完全覆盖的网格内存储的空间点的数据作为查询结果;以及,对于在所述网格系统中与该查询范围相交的网格内存储的空间点的数据,滤除不属于所述查询范围的空间点的数据,将剩余的空间点的数据作为查询结果,具体包括:将在简化后的网格系统中该查询范围完全覆盖的网格内存储的空间点的数据作为查询结果;以及,对于在简化后的网格系统中与该查询范围相交的网格内存储的空间点的数据,滤除不属于所述查询范围的空间点的数据,将剩余的空间点的数据作为查询结果。本专利技术根据查询范围的大小,动态提升(简化)网格编号的等级,从而达到简化查询实现,提高查询效率的目的。较佳地,所述根据查询范围,确定在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格之后,该方法还包括:根据所述确定的在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格,对所述网格系统的网格进行合并,并确定合并后的网格的编号;所述将在所述网格系统中该查询范围完全覆盖的网格内存储的空间点的数据作为查询结果;以及,对于在所述网格系统中与该查询范围相交的网格内存储的空间点的数据,滤除不属于所述查询范围的空间点的数据,将剩余的空间点的数据作为查询结果,具体包括:将在合并后的网格系统中该查询范围完全覆盖的网格内存储的空间点的数据作为查询结果;以及,对于在合并后的网格系统中与该查询范围相交的网格内存储的空间点的数据,滤除不属于所述查询范围的空间点的数据,将剩余的空间点的数据作为查询结果。本专利技术通过对网格系统的网格进行合并,从而也可以达到简化查询实现,提高查询效率的目的,可以进一步降低读取数据时的开销。较佳地,对所述需要查询的网格中存储的空间点的数据进行查询的过程中,每次查询一页数据,每页数据包括多个非连续编号的网格中存储的空间点的数据。本专利技术通过该翻页策略,可以实现均匀化地图撒点,使得查询的结果在网格上的分布更加均匀。本专利技术实施例提供的一种空间点数据的处理装置,包括:第一单元,用于根据已知空间点的坐标所处的范围,确定网格范围,并根据已知空间点的数量,确定网格级别,根据所述网格范围和网格级别生成网格系统,该网格系统中包括多个网格;第二单元,用于针对每一已知空间点的坐标,根据该已知空间点的坐标,确定在所述网格系统中该已知空间点对应的网格编号;第三单元,用于将每一已知空间点的数据存储到在所述网格系统中对应的网格编号的网格中。较佳地,该装置还包括第四单元,用于:根据查询范围,确定在所本文档来自技高网
...
一种空间点数据的处理方法及装置

【技术保护点】
一种空间点数据的处理方法,其特征在于,该方法包括:根据已知空间点的坐标所处的范围,确定网格范围,并根据已知空间点的数量,确定网格级别,根据所述网格范围和网格级别生成网格系统,该网格系统中包括多个网格;针对每一已知空间点的坐标,根据该已知空间点的坐标,确定在所述网格系统中该已知空间点对应的网格编号;将每一已知空间点的数据存储到在所述网格系统中对应的网格编号的网格中。

【技术特征摘要】
1.一种空间点数据的处理方法,其特征在于,该方法包括:根据已知空间点的坐标所处的范围,确定网格范围,并根据已知空间点的数量,确定网格级别,根据所述网格范围和网格级别生成网格系统,该网格系统中包括多个网格;针对每一已知空间点的坐标,根据该已知空间点的坐标,确定在所述网格系统中该已知空间点对应的网格编号;将每一已知空间点的数据存储到在所述网格系统中对应的网格编号的网格中。2.根据权利要求1所述的方法,其特征在于,该方法还包括:根据查询范围,确定在所述网格系统中需要查询的网格;对所述需要查询的网格中存储的空间点的数据进行查询,确定查询结果。3.根据权利要求2所述的方法,其特征在于,根据查询范围,确定在所述网格系统中需要查询的网格,具体包括:根据查询范围,确定在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格;对所述需要查询的网格中存储的空间点的数据进行查询,确定查询结果,具体包括:将在所述网格系统中该查询范围完全覆盖的网格内存储的空间点的数据作为查询结果;以及,对于在所述网格系统中与该查询范围相交的网格内存储的空间点的数据,滤除不属于所述查询范围的空间点的数据,将剩余的空间点的数据作为查询结果。4.根据权利要求3所述的方法,其特征在于,所述根据查询范围,确定在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格之前,该方法还包括:根据查询范围的大小,将所述网格系统的级别进行简化,使得所述网格系统中的网络数量减少;所述根据查询范围,确定在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格,具体包括:根据查询范围,确定在简化后的网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格;所述将在所述网格系统中该查询范围完全覆盖的网格内存储的空间点的数据作为查询结果;以及,对于在所述网格系统中与该查询范围相交的网格内存储的空间点的数据,滤除不属于所述查询范围的空间点的数据,将剩余的空间点的数据作为查询结果,具体包括:将在简化后的网格系统中该查询范围完全覆盖的网格内存储的空间点的数据作为查询结果;以及,对于在简化后的网格系统中与该查询范围相交的网格内存储的空间点的数据,滤除不属于所述查询范围的空间点的数据,将剩余的空间点的数据作为查询结果。5.根据权利要求3所述的方法,其特征在于,所述根据查询范围,确定在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格之后,该方法还包括:根据所述确定的在所述网格系统中与该查询范围相交的网格和该查询范围完全覆盖的网格,对所述网格系统的网格进行合并,并确定合并后的网格的编号;所述将在所述网格系统中该查询范围完全覆盖的网格内存储的空间点的数据作为查询结果;以及,对于在所述网格系统中与该查询范围相交的网格内存储的空间点的数据,滤除不属于所述查询范围的空间点的数据,将剩余的空间点的数据作为查询结果,具体包括:将在合并后的网格系统中该查询范围完全覆盖的网格内存储的空...

【专利技术属性】
技术研发人员:李欣周大良李强罗继
申请(专利权)人:方正国际软件北京有限公司方正国际软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1