一种基于网络拓扑的平衡二叉树修复方法技术

技术编号:20081179 阅读:25 留言:0更新日期:2019-01-15 02:38
本发明专利技术属于数据存储领域,具体涉及一种基于网络拓扑的平衡二叉树修复方法。包括以下步骤:构建修复平衡二叉树;数据修复。本发明专利技术所述的是一种基于平衡二叉树的纠删码技术,克服传统采用星型结构的纠删码在数据修复时,占用较高网络带宽的问题,提高修复效率,降低修复时间。

A Restoration Method of Balanced Binary Tree Based on Network Topology

The invention belongs to the field of data storage, in particular to a balanced binary tree repair method based on network topology. It includes the following steps: constructing repair balanced binary tree; data repair. The invention relates to an erasure code technology based on balanced binary tree, which overcomes the problem that the traditional star-shaped erasure code occupies a higher network bandwidth in data restoration, improves the repair efficiency and reduces the repair time.

【技术实现步骤摘要】
一种基于网络拓扑的平衡二叉树修复方法
本专利技术属于数据存储领域,具体涉及一种基于网络拓扑的平衡二叉树修复方法。
技术介绍
进入大数据时代,数据的规模呈迅速发展的趋势,体量变得越来越庞大。规模庞大并且仍然在不断迅速增长的数据,对构建良好的存储系统提出了重大挑战。数据容错是大规模分布式存储系统中一项不可或缺的关键技术,由于数据量极为庞大,该类存储系统往往包含几千甚至几万个存储节点。因此,采用一定的数据容错技术,从而保证在部分存储节点失效的情况下数据仍然能够被正常地访问就显得尤为重要。分布式存储系统中常用的数据容错技术有两种:一种是多副本容错技术,通过复制进行容错;另一种是纠删码容错技术,通过编码进行容错。与多副本容错技术相比,纠删码容错技术可以有效降低存储空间消耗并提供较好的数据容错能力。目前,网络带宽资源是制约利用纠删码进行数据修复的主要瓶颈。分布式存储系统中降低网络带宽资源占用的方法有以下两种:一、优化纠删码的结构;二,优化数据修复的过程,通过优化数据修复时的数据读取和数据传输效率,提高数据修复的效率。传统的数据修复方法通常采用星型拓扑结构作为数据传输方式,所有帮助节点直接将数据发送给新生节点,所有参与修复的节点构成一个以新生节点为中心的星型结构。基于星型结构的数据修复方法具有简单直观的优点,但存在占用较高网络带宽的问题。综上所述,现有技术中存在受限于新生节点的网络带宽未考虑到、网络拓扑对修复占用网络资源的影响等问题。
技术实现思路
本专利技术的目的是针对传统星型结构的数据修复方式存在的网络带宽占据较高的问题,提出一种基于平衡二叉树的纠删码技术,利用平衡二叉树左右子树高度差小于等于1的性质,将参与修复的节点组织成网络距离较小的树形结构,缩短修复期间数据的传输距离,降低修复时的网络带宽和修复时间,提升修复效率。一种基于网络拓扑的平衡二叉树修复方法,包括以下步骤:(1.1)构建修复平衡二叉树;(1.2)数据修复。所述构建修复平衡二叉树,包括以下步骤:(2.1)根据所采用的纠删码确定用来修复失效块c0的编码块c1,c2,Λ,cr,并计算出相应的修复系数向量(β1β2…βr);(2.2)从系统中获得用以修复的编码块分别所在节点,记为V1,V2,Λ,Vr,并根据系统放置策略确定出新生节点,记为V0,并记录下相互之间的网络距离;(2.3)根据节点之间的网络距离构建出修复所有的平衡二叉树。所述数据修复,包括:如果用以修复的编码块所在节点为树中的叶子节点,则负责从本地存储系统中读取编码块ci,并计算出βici,然后将其发送给自己的父节点;如果用以修复的编码块所在节点为内部节点,则负责接受其子节点发送过来的数据,并从本地存储系统中读取编码块,将结果加在一起之后再次发送给自己的父节点;如果用以修复的编码块所在节点为根节点,则负责接受其子节点发送过来的数据,计算出总和,然后将结果写入本地存储。本专利技术的有益效果在于:本专利技术所述的是一种基于平衡二叉树的纠删码技术,克服传统采用星型结构的纠删码在数据修复时,占用较高网络带宽的问题,提高修复效率,降低修复时间。附图说明图1是星型数据修复方法原理图;图2是树形数据修复方法原理图。具体实施方式下面结合附图对本专利技术做进一步描述。本专利技术属于数据存储领域,具体涉及到分布式存储系统中数据恢复问题,利用一种基于平衡二叉树的纠删码技术恢复分布式存储系统中丢失的数据。进入大数据时代,数据的规模呈迅速发展的趋势,体量变得越来越庞大。规模庞大并且仍然在不断迅速增长的数据,对构建良好的存储系统提出了重大挑战。数据容错是大规模分布式存储系统中一项不可或缺的关键技术,由于数据量极为庞大,该类存储系统往往包含几千甚至几万个存储节点。因此,采用一定的数据容错技术,从而保证在部分存储节点失效的情况下数据仍然能够被正常地访问就显得尤为重要。分布式存储系统中常用的数据容错技术有两种:一种是多副本容错技术,通过复制进行容错;另一种是纠删码容错技术,通过编码进行容错。与多副本容错技术相比,纠删码容错技术可以有效降低存储空间消耗并提供较好的数据容错能力。目前,网络带宽资源是制约利用纠删码进行数据修复的主要瓶颈。分布式存储系统中降低网络带宽资源占用的方法有以下两种:一、优化纠删码的结构;二,优化数据修复的过程,通过优化数据修复时的数据读取和数据传输效率,提高数据修复的效率。传统的数据修复方法通常采用星型拓扑结构作为数据传输方式,所有帮助节点直接将数据发送给新生节点,所有参与修复的节点构成一个以新生节点为中心的星型结构。基于星型结构的数据修复方法具有简单直观的缺点,但存在占用较高网络带宽的问题。本专利技术的目的是针对传统星型结构的数据修复方式存在的网络带宽占据较高的问题,提出一种基于平衡二叉树的纠删码技术,利用平衡二叉树左右子树高度差小于等于1的性质,将参与修复的节点组织成网络距离较小的树形结构,缩短修复期间数据的传输距离,降低修复时的网络带宽和修复时间,提升修复效率。本专利技术所述的是一种基于平衡二叉树的纠删码技术,克服传统采用星型结构的纠删码在数据修复时,占用较高网络带宽的问题,提高修复效率,降低修复时间。图1星型数据修复方法图2树形数据修复方法下面将结合附图对本专利技术加以详细说明,应指出的是,所描述的实施例仅旨在便于解释本专利技术,并不构成对本专利技术的限制。本专利技术提出一种基于平衡二叉树的纠删码技术。如图一所示,传统的数据修复方法是采用星型的数据传输方式,提供修复的参与节点直接将数据发送给新生节点,所有节点围绕着新生节点为中心形成一个星型的结构,失效的编码块c5可用编码块c1,c2,c3和c4来修复,其关系如式(1)所示。c5=β1c1+β2c2+β3c3+β4c4+β5c5(1)星型结构所占用的网络资源等于帮助节点到新生节点的网络资源之和,修复的速度也受限于新生节点的网络带宽,为了降低纠删码的修复时间,如图2所示,提出一种基于节点间可用带宽的树形修复方法,该方法根据修复时节点间可用带宽来建立树形修复结构,以提高修复速度。然而,传统的星型修复方法和上述基于节点间可用带宽的树形修复方法都没有考虑到网络拓扑对修复占用网络资源的影响,为此,提出一种基于平衡二叉树结构的树形修复方法,它根据网络拓扑结构来构建树形修复结构。如果是传统的星型或者树形结构,在网络拓扑中,节点与节点相连,这样有一些链路可能会很长,消耗的网络资源也比较大。如果将节点看作是平衡二叉树的叶子节点,则平衡二叉树的左右子树的深度差有不能超过1层的约束,这样使得这种排列的树是同种元素序列情况下的深度最小的二叉树,这样减少了元素的深度,也就是减少了计算的步骤,缩短了网络拓扑中链路总数的长度。基于网络拓扑的纠删码树形修复方法的具体修复过程可以分为两大步。第1步,构建修复树。根据所采用的纠删码确定可用来修复失效块c0的编码块c1,c2,Λ,cr,并计算出相应的修复系数向量(β1β2…βr);从系统中获得用以修复的编码块分别所在节点,记为V1,V2,Λ,Vr,并根据系统放置策略确定出新生节点,记为V0,记录下相互之间的网络距离;根据节点之间的网络距离构建出修复所有的平衡二叉树。第2步,数据修复。如果为树中的叶子节点,则负责从本地存储系统中读取编码块ci,并计算出βici,然后将其发送给自己本文档来自技高网...

【技术保护点】
1.一种基于网络拓扑的平衡二叉树修复方法,其特征在于,包括以下步骤:(1.1)构建修复平衡二叉树;(1.2)数据修复。

【技术特征摘要】
1.一种基于网络拓扑的平衡二叉树修复方法,其特征在于,包括以下步骤:(1.1)构建修复平衡二叉树;(1.2)数据修复。2.根据权利要求1所述的方法,其特征在于,所述构建修复平衡二叉树,包括以下步骤:(2.1)根据所采用的纠删码确定用来修复失效块c0的编码块c1,c2,Λ,cr,并计算出相应的修复系数向量(β1β2…βr);(2.2)从系统中获得用以修复的编码块分别所在节点,记为V1,V2,Λ,Vr,并根据系统放置策略确定出新生节点,记为V0,并记录下相互之间的网络距离;(2.3)根据节...

【专利技术属性】
技术研发人员:关智允张玲玲任龙王磊王鑫徐东孟宇龙张子迎李贤宫思远
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1