分布式计算机存储系统中数据副本异构存储与访问方法技术方案

技术编号：17485828 阅读：100 留言：0更新日期：2018-03-17 10:16

本发明专利技术涉及一种分布式计算机存储系统中数据副本异构存储与访问方法，属于计算机数据管理技术领域。首先根据用户指定的属性优先级和数据副本数n进行属性分配，每个数据副本对应一个存储特征，并根据存储特征创建各个数据副本的存储模型，随后将数据写入到n个数据副本中；在访问请求到来时，解析访问条件，生成访问属性集，计算各个数据副本的访问优先级，找出最佳访问数据副本进行访问。本发明专利技术将不同数据副本按照用户访问特点按不同属性排序存储，从而使分布式计算机存储系统中数据的多个数据副本能够快速响应用户在数据不同属性上的访问请求，使得多副本技术在提高系统可用性的基础上，还提升了系统的访问性能。

Heterogeneous storage and access method of data copy in distributed computer storage system

全部详细技术资料下载

【技术实现步骤摘要】
分布式计算机存储系统中数据副本异构存储与访问方法
本专利技术涉及一种分布式计算机存储系统中数据副本异构存储与访问方法，属于计算机数据管理

技术介绍
工业领域需要处理的数据通常具有多个属性，如工业领域风机传感器观测到的数据，每一条数据包含采样时间、设备编号、风速等属性；可移动设备中GPS传感器产生的每一条数据包含采样时间、设备编号、经纬度、高度等属性。用户会对这些数据进行访问，如：访问某个时间段的数据、访问某些设备的数据等。分布式计算机存储系统需根据用户的访问请求快速找到所需数据。在分布式计算机存储系统中，为了提高系统的性能以及可用性，将数据以多副本的形式进行存储已成为一种共识。多副本技术是指将一份数据复制多份，并将各数据副本分别存放在分布式计算机存储系统的不同节点上。当某个(或某些)节点宕机时，会导致相应数据副本无法访问。在此情况下，只要有一份数据副本可以正常访问，分布式计算机存储系统就可以正常使用，以此提高系统的可用性。现在流行的分布式计算机存储系统大多采用了多副本技术，如HDFS，Cassandra，MongoDB，Hbase，Dynamo等。分布式计算机存储系统通常有两种架构，P2P对等架构和中心架构，对于这两种架构，在访问请求来临时，处理请求并协调工作的节点称为协调者节点，接收协调者节点请求的为非协调者节点。在分布式计算机存储系统中，数据可以按照表结构进行管理，一个表结构是由若干列组成的。在一个节点内，表中的多行数据会以某列或者某几列的列值进行排序存储，这些列被称为排序列。用户在建表的时候通过指定排序列，就可以间接地控制数据在磁盘上的存储...
分布式计算机存储系统中数据副本异构存储与访问方法

【技术保护点】
一种分布式计算机存储系统中数据副本异构存储与访问方法，其特征在于，记分布式计算机存储系统的节点集合为S，其中A是协调者节点，其他n个节点为非协调者节点；系统中的数据由k个属性组成，记系统中各数据的数据副本数均为n，以上属性均由用户设置；该方法包括以下步骤：(1)协调者节点A接收客户端请求，判断接收的客户端请求是否为建立数据副本结构请求，若是，则执行步骤(2)，否则判断接收的客户端请求是否为数据导入请求，若是，则执行步骤(3)，否则执行步骤(4)；(2)建立数据副本结构(2‑1)协调者节点A接收用户指定的各属性的访问优先级，访问优先级范围为从1到n的正整数；访问优先级数值越高，表明对应的属性越被频繁用于做访问条件；对于用户不指定的属性，则默认访问优先级为1；(2‑2)协调者节点A将k个属性按照访问优先级从高到底排序，相同优先级的属性随机排序，排好序的属性列表记为P，P＝(p_1,p_2,…,p_i,…,p_k)，其中p_i表示按照访问优先级从高到底排序后的第i个属性，1≤i≤k；将属性p_i分配给第(i‑1)％n+1个数据副本，其中％为取模符号；将数据副本r分配到的m_r个属性按优先级从...

【技术特征摘要】
1.一种分布式计算机存储系统中数据副本异构存储与访问方法，其特征在于，记分布式计算机存储系统的节点集合为S，其中A是协调者节点，其他n个节点为非协调者节点；系统中的数据由k个属性组成，记系统中各数据的数据副本数均为n，以上属性均由用户设置；该方法包括以下步骤：(1)协调者节点A接收客户端请求，判断接收的客户端请求是否为建立数据副本结构请求，若是，则执行步骤(2)，否则判断接收的客户端请求是否为数据导入请求，若是，则执行步骤(3)，否则执行步骤(4)；(2)建立数据副本结构(2-1)协调者节点A接收用户指定的各属性的访问优先级，访问优先级范围为从1到n的正整数；访问优先级数值越高，表明对应的属性越被频繁用于做访问条件；对于用户不指定的属性，则默认访问优先级为1；(2-2)协调者节点A将k个属性按照访问优先级从高到底排序，相同优先级的属性随机排序，排好序的属性列表记为P，P＝(p_1,p_2,…,p_i,…,p_k)，其中p_i表示按照访问优先级从高到底排序后的第i个属性，1≤i≤k；将属性p_i分配给第(i-1)％n+1个数据副本，其中％为取模符号；将数据副本r分配到的m_r个属性按优先级从高到底排序，r＝1,2,…,n，排序后的m_r个属性称为该数据副本r的存储特征，记做Y_r＝(y_1,y_2,…,y_m_r)；协调者节点A将各个数据副本的存储特征发送给对应的非协调者节点；(2-3)所有非协调者节点接收存储特征后，根据各自的存储特征分别建立数据副本结构，并保存各自的存储特征；(2-4)返回步骤(1)；(3)数据导入(3-1)判断对应的数据副本结构是...

【专利技术属性】
技术研发人员：王建民，黄向东，乔嘉林，龙明盛，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人