当前位置: 首页 > 专利查询>青岛大学专利>正文

一种面向全空间的数据模型的建模方法技术

技术编号:24756143 阅读:63 留言:0更新日期:2020-07-04 09:09
本发明专利技术公开了一种基于Hash地理编码的面向全空间的数据模型的建立方法,包括以下步骤:S1,基于Hash明文地理编码索引的P2P协议文件调度,分别对节点、文件生成基于Hash的地理编码用于索引。S2:基于Hash地理编码索引的数据结点网络搭建;S3:全球虚拟环境数据分享原型与实验平台搭建与评测;S4:多粒度编码规则制定;S5:基于Hash地理编码的空间对象大数据存储;S6:设计NoSQL数据库。本发明专利技术的优点是:为多粒度时空数据库或全空间信息系统的建立提供支持;实现数据存储环境与现实世界中对象间相对位置的统一。

A modeling method for full space oriented data model

【技术实现步骤摘要】
一种面向全空间的数据模型的建模方法
本专利技术涉及人工智能
,特别涉及一种基于Hash地理编码的面向全空间的数据模型的建立方法。
技术介绍
众所周知,当今社会的一个重大变化是人工智能(ArtificialIntelligence)时代的来临。人工智能产业已经迎来黄金发展期。人工智能时代,整个社会的生活方式发生了巨大变化,人们的工作、娱乐、购物、社交、学习和医疗等越来越依赖互联网和人工智能技术。而人工智能应用中的一个关键技术就是空间数据的结构划分与索引。国际上宏观空间索引的研究已十分丰富,有诸如SpatialKeys和QuadTiles等剖分和编码机制的研究。较成熟的项目包括商业数据库Oracle中空间数据引擎OracleSpatial和Postgres项目提供的空间数据分布和并行管理模块PostGIS。然而空间数据库与其他学科交叉的研究还刚刚起步。对于虚拟空间中的宏观与微观空间数据联合利用方面,美国PublicVR研究组介绍了以基于虚拟世界进行科学研究的概念[1]。华盛顿大学的研究组在《Science》上发表文章以flodit为例本文档来自技高网...

【技术保护点】
1.一种基于Hash地理编码的面向全空间的数据模型的建立方法,其特征在于,包括以下步骤:/nS1,基于Hash明文地理编码索引的P2P协议文件调度,分别对节点、文件生成基于Hash的地理编码用于索引;/nS2:基于Hash地理编码索引的数据结点网络搭建;/n每个获取数据节点访问网络时记录其登陆所在地块的地理编码,作为该节点当前地理编码前4n位,并以2n位的二进制用户ID为尾数,组成节点定位编码;节点移动的过程中,当其跨越至其他空间区域,地理编码变动,相应的节点定位编码也重新快速生成;同时,节点将重新计算同本地节点列表中各节点的逻辑距离,向逻辑距离最近的n个节点发送需求数据的地理编码,每个在线节...

【技术特征摘要】
1.一种基于Hash地理编码的面向全空间的数据模型的建立方法,其特征在于,包括以下步骤:
S1,基于Hash明文地理编码索引的P2P协议文件调度,分别对节点、文件生成基于Hash的地理编码用于索引;
S2:基于Hash地理编码索引的数据结点网络搭建;
每个获取数据节点访问网络时记录其登陆所在地块的地理编码,作为该节点当前地理编码前4n位,并以2n位的二进制用户ID为尾数,组成节点定位编码;节点移动的过程中,当其跨越至其他空间区域,地理编码变动,相应的节点定位编码也重新快速生成;同时,节点将重新计算同本地节点列表中各节点的逻辑距离,向逻辑距离最近的n个节点发送需求数据的地理编码,每个在线节点接收到信息后,本地搜索同时也将该地理编码信息向各自的本地节点列表中发送;以递归法搜索到所需数据之后,将存在数据的节点加入至本地节点列表中,并对数据获取;当节点退出后标识为离线;
S3:全球虚拟环境数据分享原型与实验平台搭建与评测;
利用WebVR引擎作为数据的可视化引擎,对数据的调度时序、渐进式传输规则进行观察;对访问节点兴趣区域AOI进行三维表现,动态反映对兴趣区域内三维数据和用户节点变化的响应策略;对覆盖网络进行可视化表达,对其中有关联的节点之间的联系将着重表达;对不同源的同段数据传输及针对单节点的不同数据流出都采取相应三维可视化方法表现;基于实验数据,通过三维可视化方法对观察到的表现结果进行评测,总结该模型对于多尺度空间数据的支持,数据搜索速度和命中率,以及数据需求跨越从微观到宏观不同尺度时的过渡获取方式的效果;
S4:多粒度编码规则;
将地球表面数据剖分成基本单元并继续剖分至分子尺度,利用Hash函数将各基本单元内地理地址按照剖分等级计算为定长二进制散列明文数值串,形成明文地理编码,对两个尺度间的各个过渡尺度数据进行组织;通过异或运算计算N个邻居单元的相对位置以及数据的相关性,时间复杂度为O(logN),适用于分布式、大数据量索引;基于WebVR引擎向数据存储网络拓展,对宏观向微观跨越过渡的数据调度过程可视化,且数据传输更稳定;
S5:基于Hash地理编码的空间对象大数据存储;
存储体系结构主要由三部分组成:NoSQL数据库、分布式P2P存储和空间数据库引擎;NoSQL数据库使用了Accumulo;分布式P2P存储使用WebVR内部分布式文件系统;
S6:设计NoSQL数据库,子步骤如下:
S61:Hash地理编码Geohash组合;
将检索对象分为点数据、线数据和面数据;
点数据空间信息的基本存储是采用二维坐标;
线数据是矢量的形式;
S62:索引行;
线性索引行分别包括点和线的16位/24位线性参考索引,即Geohash以及hash地理编码的最后16/24位;
线性参考索引的对象包括点数据和线数据,并且点数据和线数据各自使用单个线性参考值作为初始参考;关于这种差异,还需要区分线性参考索引线的格式;显示了点和线数据的不同索引格式;根据地理对象中的条件,线性参考系统使用8位地理对象区段编码;线性参考系统只能在特定地理对象部分下工作;“P”代表点数据,“L”代表线数据;点数据只需要一个值,但是线数据需要两个值来存储起点和终点;点数据的线性参考索引行的行键长度为16字节;行数据的行键是24字节,用“N”来填补空缺;“N”还将线数据的起点和终点分开;
列族仅起区别作用;对于点数据,列限定符存储相应的点标识符,点数据的空间坐标存储在该值中;对于行数据,行键已经定义了它的空间位置,尽管只需要一个行数据实例的时间标识;标识符可以存储大量信息,例如日照时间、隔音条件和热传导;因此,线路数据不仅存储参考信息,还存储真实的情况信息;行数据的属性信息可以存储在该值中;该值可以是简单的数字类型;也可以是结构化字符串;对于行数据,数据格式不仅具有索引功能,还保留了实际数据;这是因为线数据仅通过线性参考系统查询,并且数据结构相对简单;
点数据通过线性参考系统进行索引;
多边形数据具有基本相同的索引行;但是,它存储在不同的表中;行键是hash地理编码;多边形数据索引行使用8位Geohash编码;对于多边形数据,使用空间网格切片,网格分区以空间网格索引存储在多边形数据中;在列键中,列族存储一个元素用于标识;“A”是多边形数据的标识符;通过检索行和列族键,我们可以获得相应的Hash地理编码多边形数据标识符;列可见性可用于访问控制;多边形数据的空间信息存储在值部分中;多边形数据用边界向量表示;
S63:数据行;
点数据和索引行存储在不同的数据表中;列族存储点数据限定符;列族和行索引具有相同的行键,从而将索引和数据行保持在同一区域中;此特定字段不符合“列限定符+值”的格式;该字段仅标识特定列中的“y”或“n”;该字段可以直接筛选限定符列表,并且不需要读取该值;其他点数据信息以“列限定符+值对”的格式存储;空间坐标以一组坐标分量的形式存储;地理对象截面的地理对象线性ID和线性参考值直接存储在该值中;元数据以XML或相应值中的其他结构化数据的形式存储;点数据类型的来源需要区分位移监测、视频监测和温度监测;列族限定符可以任意添加或删除,因此可以将点的存储合并到具有相同点ID的数据中,该数据具有相同的空间位置;列限定符可以分离不同类型的点数据;在时间标识的基础上,将点数据分割成不同的时间点和版本;不同类型的数据存储在特定的存储值中;根据不同的存储方法,点数据可以被分割成单个数据值、小文件或大文件;单个数据值直接存储在值中;小文件以文本或二进制编码的形式存储在值中;大型文件被分发并存储在P2P中,其值是数据的路径;
与点数据不同,面数据可以对应于多个hash地理编码,因此面数据不能使用与点数据类似的方法来存储行键;多边形数据包括空间范围、数据类型和数据列族;空间范围列族包含hash地理编码、坐标范围确定器;hash地理编码的相应值存储在空间编码集中;相应的坐标范围值存储集合的最大值和最小值的经度和纬度;相应的边界矢量值以端对端坐标的形式存储在集合中,或者以其他矢量文件格式存储;数据列族包含元数据、小文件和大文件,如列限定符;类似于点数据行,我们可以根据时间标识区分不同时间和不同版本的数据。


2.根据权利要求1所述的方法,其特征在于,S1的子步骤如下:
S11:基于地理相关的Hash明文地理编码数据库建立规则;
需要的原始数据包括矢量、高程、影像、三维网格、三维模型纹理、蛋白质结构数据;在宏观地球尺度上,对矢量数据、高程和影像数据进行多尺度空间划分,每一尺度级别以4位二进制Hash明文保存,划分n次后每块数据可以表示为将n个尺度的Hash明文依照逐渐划分的顺序由高位至低位组合而成的4n位Hash明文,作为其地理编码,同各尺度标识进行映射;对于三维网格与纹理数据,将其所在的前m-1次划分地块的Hash明文依照逐渐划分的顺序由高位至低位组合而成的4(m-1)位Hash明文,三维网格本身以4位Hash明文表示,两相叠加,组合为4m位Hash明文,作为其地理编码,并同各尺度标识和数据名称相映射;对每个三维数据继续进行基于八叉树的划分,以4位记录每次划分,划分k次至分子尺度,建立4k位Hash明文索引,存入数据库;将各类数据的地理编码同其映射存入数据库中的不同字段,并建立索引;
S12:基于Hash地理编码索引的虚拟对等网络搭建;
对于每个用户节点,取当前地理编码前128位,即前8个前缀,作为该节点...

【专利技术属性】
技术研发人员:吕智涵
申请(专利权)人:青岛大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1