基于MPP数据库的数据多分片存储方法及装置制造方法及图纸

技术编号:24408793 阅读:33 留言:0更新日期:2020-06-06 08:15
本发明专利技术实施例提供一种基于MPP数据库的数据多分片存储方法及装置,所述方法包括:获取每一主机的每一物理配置参数的量化值;根据每一主机的每一物理配置参数的量化值,分别为每一主机分配不同数量的数据分片和不同大小的数据分片。本发明专利技术实施例提供的基于MPP数据库的数据多分片存储方法及装置,根据MPP数据库集群中每一主机的物理配置,自适应地为每一主机分配不同数量的数据分片和不同大小的数据分片,有效地消除了MPP数据库的木桶效应缺陷,提高了MPP数据库的数据存储和数据计算的效率,促使MPP数据库在灵活性和通用性上更进一步。

Method and device of data multi segment storage based on MPP database

【技术实现步骤摘要】
基于MPP数据库的数据多分片存储方法及装置
本专利技术实施例涉及数据库
,尤其涉及一种基于MPP数据库的数据多分片存储方法及装置。
技术介绍
多分片技术解决了大规模并行处理(MassivelyParallelProcessing,MPP)数据库集群的单机故障时,集群性能下降过于严重的问题,即大家熟知的木桶效应或者短板效应问题。现有技术中,主流的MPP数据库包括Vertica、Greenplum、GBase等,其中GBase和Greenplum都已经实现多分片机制,两款产品多分片机制类似,都是将一台主机上的数据根据哈希hash分布算法切分成均匀的N份,每一份为一个数据分片,简称分片或segment,实现方法略有区别。GBase实现方式是单台主机上只安装一个节点数据库,在节点数据库中将数据切分成均匀N个segment;而Greenplum是在单台主机上安装多个节点数据库,然后将数据均匀切分成多份,存储在每个节点数据库中。无论是GBase还是Greenplum,现有单分片或者多分片机制都要求各节点分片数据分布均匀。从MP本文档来自技高网...

【技术保护点】
1.一种基于MPP数据库的数据多分片存储方法,其特征在于,包括:/n获取每一主机的每一物理配置参数的量化值;/n根据每一主机的每一物理配置参数的量化值,分别为每一主机分配不同数量的数据分片和不同大小的数据分片。/n

【技术特征摘要】
1.一种基于MPP数据库的数据多分片存储方法,其特征在于,包括:
获取每一主机的每一物理配置参数的量化值;
根据每一主机的每一物理配置参数的量化值,分别为每一主机分配不同数量的数据分片和不同大小的数据分片。


2.根据权利要求1所述的方法,其特征在于,所述根据每一主机的每一物理配置参数的量化值,分别为每一主机分配不同数量的数据分片和不同大小的数据分片,具体包括:
根据每一主机的每一物理配置参数的量化值,获取每一物理配置参数的最小量化值;
分别根据每一物理配置参数的最小量化值,计算每一主机的每一物理配置参数的相对评分;
分别根据每一主机的每一物理配置参数的相对评分,获取每一主机的综合评分;
分别将每一主机的综合评分,输入至预设算法模型,输出分配给每一主机的数据分片的数量和大小。


3.根据权利要求2所述的方法,其特征在于,所述根据每一物理配置参数的最小量化值,计算每一主机的每一物理配置参数的相对评分的计算公式如下:
Sij=Aij/Pj_min*100
其中,Sij为第i个主机的第j个物理配置参数的相对评分,Aij为第i个主机的第j个物理配置参数的量化值,Pj_min为第j个物理配置参数的最小量化值。


4.根据权利要求3所述的方法,其特征在于,所述分别根据每一主机的每一物理配置参数的相对评分,获取每一主机的综合评分的计算公式如下:
Si=min{Si1,Si2,…,Sij}
其中,Si为第i个主机的综合评分,Si1为第i个主机的第1个物理配置参数的相对评分,Si2为第i个主机的第2个物理配置参数的相对评分,Sij为第i个主机的第j个物理配置参数的相对评分。


5.根据权利要求4所述的方法,其特征在于,所述预设算法模型如下:



Ni=Si*N/K*Mi
其中,Mi为分配给第i个主机的数...

【专利技术属性】
技术研发人员:朱祥磊
申请(专利权)人:中国移动通信集团山东有限公司中国移动通信集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1