【技术实现步骤摘要】
一种分布式存储系统中数据写入/读取方法
本专利技术属于计算机存储
,尤其涉及一种分布式存储系统中数据写入/读取方法。
技术介绍
随着大数据时代的降临,业务应用对存储空间的需求越来越大,性能越来越高。海量的数据对存储的要求已经远远超出了传统的多控存储系统所能承受的范围。没有哪一套单机的存储能够提供如此大的数据存储能力。存储系统正在向着大规模、分布式、虚拟化方向发展。分布式存储空间的管理,是通过某种手段或者软件将分散在多个服务器节点上的零散硬盘空间组织到一起,组成一个逻辑上连续的大型储存空间。然后,由多台存储服务器相互协作,给用户呈现一个统一的、虚拟的单一空间视图。已有的解决方案比如开源的CEPH,以及EMC和NETAPP的相关存储产品,均提供存储虚拟化和分布式管理的功能。CEPH提供分布式对象存储和块存储,以及文件系统的功能。但CEPH的实现中缺失重复数据删除这一环节,导致空间利用率不高。若使用复杂的跨节点纠删码,可以适当提升其空间利用率。但是,由于其纠删码实现过程的复杂性,导致性能降低,故障率上 ...
【技术保护点】
1.一种分布式存储系统中数据写入方法,其特征在于,包括:/n根据分布式存储系统的当前状态生成逻辑空间树,并向用户展现;/n接收用户根据所述逻辑空间树发出的写入请求信息;其中,所述写请求信息包括用户数据和写入逻辑块号;/n将每个所述数据摘要值根据所述逻辑块号存储至所述逻辑空间树中;/n将所述用户数据拆分为多个预定大小的数据对象,并计算出每个数据对象的数据摘要值;/n通过分布式哈希表生成每个数据摘要值的存储节点;/n通过网络将所述数据摘要值分别发送至对应的存储节点进行存储。/n
【技术特征摘要】
1.一种分布式存储系统中数据写入方法,其特征在于,包括:
根据分布式存储系统的当前状态生成逻辑空间树,并向用户展现;
接收用户根据所述逻辑空间树发出的写入请求信息;其中,所述写请求信息包括用户数据和写入逻辑块号;
将每个所述数据摘要值根据所述逻辑块号存储至所述逻辑空间树中;
将所述用户数据拆分为多个预定大小的数据对象,并计算出每个数据对象的数据摘要值;
通过分布式哈希表生成每个数据摘要值的存储节点;
通过网络将所述数据摘要值分别发送至对应的存储节点进行存储。
2.如权利要求1所述的一种分布式存储系统中数据写入方法,其特征在于,所述逻辑空间树的生成方法为:
将每个逻辑卷分成多个相同空间大小的逻辑节点;其中,b=n*a,b为每个逻辑节点的空间大小,n为正整数,a为数据对象的数据摘要值所占用的空间大小;
将存储有数据摘要值的逻辑节点作为逻辑空间树的叶子结点;
根据每个所述叶子节点中的数据摘要值组成生成该叶子节点的节点摘要值;
填充上层父节点:将相邻的n个叶子节点的节点摘要值填充至一个空的逻辑节点,将填充后的逻辑节点作为该n个叶子节点的上层父节点;
重复执行所述填充上层父节点步骤,直至生成的上层父节点的数量为1个,将该上层父节点作为根节点,生成所述逻辑空间树。
3.如权利要求2所述的一种分布式存储系统中数据写入方法,其特征在于,在未填充数据摘要值或节点摘要值的逻辑节点中,均引用全零对象。
4.如权利要求1所述的一种分布式存储系统中数据写入方法,其特征在于,通过分布式哈希表生成每个数据摘要值的存储节点包括:
将所述数据加密摘要值与分布式存储系统存储节点数组中的节点加密摘要值依次进行比较,直至找到大于所述数据摘要值的第一节点摘要值;
提取所述第一节点摘要值对应的第一存储节点的编号;
将所述数据摘要值对应的待存储数据对象存储至所述第一存储节点。
5.如权利要求4所述的一种分布式存储系统中数据写入方法,其特征在于,所述存储节点数组的生成包括:
获取分布式存储系统中每个存储节点的节点ID和节点容量;
按照预定的空间大小将每个所述节点容量分为多个单位容量;
采用加密摘要算法为每个所述单位容量生成对应的节点摘要值;
将每个存储节点的多个所述节点摘要值按照由小...
【专利技术属性】
技术研发人员:陈鹏,刘露,于超,
申请(专利权)人:西安奥卡云数据科技有限公司,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。