当前位置: 首页 > 专利查询>杨军专利>正文

一种基于数据复杂度的空间矢量数据的建模方法技术

技术编号:25521553 阅读:48 留言:0更新日期:2020-09-04 17:11
本发明专利技术公开了一种基于数据复杂度的空间矢量数据的建模方法,包括以下步骤:建立空间矢量数据集;计算空间矢量数据均匀度,根据公式PH=ΣNi/J和PHi=Ni/PH得到空间对象偏离值,发现原始数据的不均匀性,数据量总数与分布式计算节点数量匹配性矛盾;分割处理,遍历矢量数据集,若PHi>M,M为初始值(M=1.00),则使用Ni=F(PHi),(F(PHi):空间对象分割算法)和预处理软件对该空间对象进行水平分布,分割处理,提升数据均匀度;建立分布式空间数据库;常用指标效率对比测试。本发明专利技术通过我们提出的空间矢量数据均匀度模型,对原始数据颗粒度进行重新划分,达到分布式计算所需的合理均匀度,避免木桶效应,降低数据传输(广播)时间,大大提高计算效率。

【技术实现步骤摘要】
一种基于数据复杂度的空间矢量数据的建模方法
本专利技术涉及空间矢量数据计算
,具体涉及一种基于数据复杂度的空间矢量数据的建模方法。
技术介绍
分布式数据库将集中存储的数据分布到若干节点上存储,并通过并行计算,同时完成若干节点上数据的处理,解决集中式架构I/O吞吐瓶颈和单点计算带来的效率低下问题。在非空间信息数据库中,每条记录的各个字段由一些数字和文本构成,数据量比较均匀,计算效率非常高,而且计算效率与节点基本成线性比例提升,因此分布式架构成为目前大数据计算的主流技术。由于所有信息都具有时空属性,因此地理空间信息作为连接所有信息的天然载体,在大数据时代具有重要作用,目前地理空间大数据也广泛应用分布式架构进行巨量地理空间矢量数据的高性能计算。为了便于管理和应用,地理空间矢量数据也采用面向对象的数据建库模式,即一个空间对象在库中作为一条记录的某个字段来存储。但空间对象本身具有信息颗粒度极不均匀的问题,例如POI、控制点等点对象,数据量一般只有几个字节;河流、等高线等线对象,行政界线、地类图斑等面对象,数据量从0.1K到上百兆不等,但他们本文档来自技高网...

【技术保护点】
1.一种基于数据复杂度的空间矢量数据的建模方法,其特征在于,包括以下步骤:/nS1:建立空间矢量数据集;/nS2:计算空间矢量数据均匀度,根据公式PH=ΣNi/J(PH:平均均匀度,Ni:第i个空间对象复杂度,J:空间对象数量)得到平均均匀度值;根据公式PHi=Ni/PH(Ni:第i个空间对象复杂度,PHi:第i个空间对象偏离值)得到第i个空间对象偏离值,发现原始数据的不均匀性;/nS3:预设一个M初始值(M=1.00);/nS4:分割处理:遍历矢量数据集,若PHi>M,则使用Ni=F(PHi),(F(PHi):空间对象分割算法)和预处理软件对该空间对象进行分割处理,提升数据均匀度;/nS5:...

【技术特征摘要】
1.一种基于数据复杂度的空间矢量数据的建模方法,其特征在于,包括以下步骤:
S1:建立空间矢量数据集;
S2:计算空间矢量数据均匀度,根据公式PH=ΣNi/J(PH:平均均匀度,Ni:第i个空间对象复杂度,J:空间对象数量)得到平均均匀度值;根据公式PHi=Ni/PH(Ni:第i个空间对象复杂度,PHi:第i个空间对象偏离值)得到第i个空间对象偏离值,发现原始数据的不均匀性;
S3:预设一个M初始值(M=1.00);
S4:分割处理:遍历矢量数据集,若PHi>M,则使用Ni=F(PHi),(F(PHi):空间对象分割算法)和预处理软件对该空间对象进行分割处理,提升数据均匀度;
S5:建立分布式空间数据库;
S6:常用指标效率对比测试,若对比测试效率提...

【专利技术属性】
技术研发人员:杨军
申请(专利权)人:杨军
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1