The invention discloses a universal network coding fault-tolerant storage platform for data centers and a method for realizing the same. The system mainly includes a name node, a number of data nodes used for storage and a coding agent node, which form a data center oriented distributed storage platform for them. The storage platform is for the data center, proposes a unified processing framework based on network encoding, the encoding of the file storage, achieve in system reliability under the condition of the same system, reduce redundancy and bandwidth. The system provides integration of different coding schemes so as to achieve system scalability. The implementation method mainly includes the design of unified processing framework based on network coding, data encoding and distributed storage process, integration of different coding schemes, and recovery processing.
【技术实现步骤摘要】
面向数据中心的通用化网络编码容错存储平台及工作方法
本专利技术以开源分布式存储平台为基础,对基于多副本的数据容错技术带来的冗余开销以及额外传输带宽问题进行了研究。在此基础上,通过引入信息论中主流数据容错编码技术,对系统架构进行扩展,设计并实现了一种面向数据中心的通用化网络编码容错存储平台及其工作方法。
技术介绍
随着互联网技术的迅速发展以及海量数据的快速膨胀,海量数据的存储与管理成为业界关注的热点,同时也是“大数据处理”的重要支撑技术。分布式存储系统因其支持大容量的存储,提供良好的可扩展性,在容量、性能以及管理等方面都能够快速适应系统的变化而被广泛使用。然而随着对大容量数据、私人数据的存储效率要求越来越高,现有分布式存储系统中所采用的基于多副本的数据容错存储机制将导致系统占用过多额外存储开销以及数据传输带宽消耗,并且增加失效修复的存储空间。为提高数据存储的可靠性,降低数据的冗余率,业界对基于信息论的数据容错编码机制开展了研究,基于网络编码的分布式数据容错存储技术受到业界积极关注。
技术实现思路
本专利技术所要解决的技术问题是提供一种面向数据中心的通用化网络编码容错存储平台及其工作方法,该系统能够为系统提供多种网络编码方案,不仅有效的降低系统存储冗余度,减少传输带宽和提高系统的可靠性与耐久性,还能有效的降低修复时传输带宽消耗。该编码存储技术在系统在存储文件,读取文件以及失效文件块自我修复中都运用了基于网络编码的数据容错技术维护文件的可靠性。为实现上述目的,本专利技术所述的一种面向数据中心的通用化网络编码容错存储平台,包括:一个名字节点:名字节点作为核心服务器,管 ...
【技术保护点】
一种面向数据中心的通用化网络编码容错存储平台,其特征在于该平台包括:一个名字节点:名字节点作为核心服务器,管理文件系统中的数据块到数据节点之间的映射以及整个集群的配置信息,并负责文件系统的名字空间操作;多个数据节点:数据节点作为从节点,系统中的数据都将存储在数据节点中,数据节点在名字节点的调度下对数据块进行创建、删除和传送操作,并且通过名字节点处理文件的读写请求;一个编码代理节点:当有文件读写时,编码代理节点将原始文件编码发送到对应的数据节点中或者从对应数据节点中取数据进行解码恢复为原始文件。
【技术特征摘要】
1.一种面向数据中心的通用化网络编码容错存储平台的工作方法,该平台包括:一个名字节点:名字节点作为核心服务器,管理文件系统中的数据块到数据节点之间的映射以及整个集群的配置信息,并负责文件系统的名字空间操作;多个数据节点:数据节点作为从节点,系统中的数据都将存储在数据节点中,数据节点在名字节点的调度下对数据块进行创建、删除和传送操作,并且通过名字节点处理文件的读写请求;一个编码代理节点:当有文件读写时,编码代理节点将原始文件编码发送到对应的数据节点中或者从对应数据节点中取数据进行解码恢复为原始文件;其特征在于,该工作方法包括以下几种情况:步骤1)数据编码与分布式存储流程:编码代理节点对原始文件先进行编码,然后将多个编码数据块并行的发送到对应的数据节点中,在此过程中,系统根据文件大小以及系统对应的网络编码方案自适应的生成不同的编码信息以及对应的数据节点个数,使得系统满足自适应性;步骤2)不同编码方案的集成:提供多种编码容错方案,并提供统一的、普适的分布式文件系统,使得用户和应用程序能够根据自己具体的存储任务选择合适的方案,提高系统的多样性、对用户的友好性,满足可扩展性;步骤3)失效编码恢复处理:在系统中某些节点失效的情况下为了保证存储文件的可靠性,恢复失效编码块。2.权利要求1所述面向数据中心的通用化网络编码容错存储平台的工作方法,其特征在于步骤1)的具体流程分为文件存储和文件读取两种情况,其中:文件存储:11)当系统有文件存储时,名字节点根据文件长度和系统正在运行的编码方案生成对应的编码信息和申请对应的数据节点和数据块,在索引空间中维护并返回给编码代理节点;12)编码代理节点根据名字节点返回的数据节点地址,与每个数据节点建立连接;13)编码代理节点根据编码信息,按传输单位遍历原始文件,根据编码矩阵,将各传输单位的数据放入对应的编码缓存域或者进行编码,每遍历一定量次数后,将相应的编码缓存放入网络传输等待队列,队列非空的情况下唤醒等待的文件块传输进程,此时分为以下几种情况;131)如果当前遍历的数据所对应的编码缓存域是空,则将此数据放入对应的编码缓存域中;132)如果当前遍历的数据所对应的编码缓存域不是空,则将此数据编码并与对应编码缓存域中的数据进行异或操作;133)原始文件遍历完毕,将相应的编码缓存放入网络传输等待队列;14)文件块传输进程在网络传输等待队列为在非空的情况下被唤醒,执行文件传输操作,每发送一个数据包...
【专利技术属性】
技术研发人员:薛艳,陈正亮,叶保留,吴小志,李东辉,
申请(专利权)人:南京大学镇江高新技术研究院,南京南瑞集团公司信息系统集成分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。