一种基于去重系统的分层编码方法、装置及去重系统制造方法及图纸

技术编号：26065213 阅读：15 留言：0更新日期：2020-10-28 16:38

本发明专利技术公开了一种基于去重系统的分层编码方法、装置及去重系统，计算机存储领域，包括：预先将数据块的被引用次数划分为N个层级，并在内存中对应创建N个缓存区作为N个数据容器；编码时，当一个数据块经过去重之后，若是唯一块，则将其被引用次数记为1；否则，将其被引用次数加1；之后，将被引用次数记录到数据块的元数据中，并确定数据块所处的层级，将其存储到对应的数据容器中；当数据容器满时，按照其所处层级对应的编码方式进行编码，并将同一条带中的分块存储到不同的节点中；层级越高，对应的被引用次数范围越大，编码条带越短。本发明专利技术能够保证去重系统具有良好的存储效率，同时又保证在数据节点失效时，去重系统具有良好的修复速率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于去重系统的分层编码方法、装置及去重系统
本专利技术属于计算机存储领域，更具体地，涉及一种基于去重系统的分层编码方法、装置及去重系统。
技术介绍
伴随着VR(VirtualReality，虚拟现实)技术、短视频、网络直播等新兴互联网行业的崛起，越来越多的图片、视频等大数据量的数据内容需要保存。这对于企业和用户来说，也将面临越来越大的存储压力。尤其是对于企业来说，考虑到数据安全性和可靠性，需要定期对数据进行备份，这虽然保证了数据安全性，但是大大增加了存储的成本。对各种存储系统和备份系统中相关数据的研究发现，在系统中存在着大约60％的重复数据。该数据表明，释放重复数据占用的存储空间，可以节省出大量存储资源。因此，催生出一种新技术——数据去重技术。在存储系统中，数据去重技术可以减少传输、存储和管理的数据量，提升系统的性能，减少存储成本和管理开销，因此，数据去重技术得到了学术界和工业界的广泛关注，并逐渐成为了数据密集型存储系统和产品中的重要组成。采用了数据去重技术的存储系统，即为去重系统。纠删码因其良好的存储效率和高可靠性，常常被应用于去重系统，来提高去重系统可靠性。但纠删码有一个众所周知的修复问题，即在数据丢失后，系统进行降级读修复时会消耗大量的网络开销。当前有大量的研究针对纠删码的修复问题进行研究，但这些研究都没有考虑因数据块引用次数增加带来的修复开销问题。而由于纠删码的特性，当数据节点失效时，随着数据块的引用次数增加，被传回到客户端的数据量成倍增长，给网络资源带来了巨大压力。当前一些研究更多的是考虑使用副...

【技术保护点】
1.一种基于去重系统的分层编码方法，其特征在于，包括：/n预定义N-1个阈值，用于将数据块的被引用次数划分为N个层级，并预先在去重系统的内存中创建N个缓存区作为N个数据容器，用于对应存储N个层级的数据块；/n在数据块编码时，当一个数据块经过去重之后，若该数据块是唯一块，则将其被引用次数记为1；若该数据块不是唯一块，则将其被引用次数加1；将更新之后的被引用次数记录到数据块的元数据中，并根据更新之后的被引用次数确定数据块所处的层级，将该数据块存储到对应层级的数据容器中；/n当任意一个数据容器满时，按照其所处层级对应的编码方式，对其中的数据块进行编码，并将同一条带中的分块存储到不同的节点中；层级越高，对应的被引用次数范围越大，且对应的编码条带越短；/n其中，N为大于1的正整数；条带中的分块为该条带内的数据块或校验块。/n

【技术特征摘要】
1.一种基于去重系统的分层编码方法，其特征在于，包括：
预定义N-1个阈值，用于将数据块的被引用次数划分为N个层级，并预先在去重系统的内存中创建N个缓存区作为N个数据容器，用于对应存储N个层级的数据块；
在数据块编码时，当一个数据块经过去重之后，若该数据块是唯一块，则将其被引用次数记为1；若该数据块不是唯一块，则将其被引用次数加1；将更新之后的被引用次数记录到数据块的元数据中，并根据更新之后的被引用次数确定数据块所处的层级，将该数据块存储到对应层级的数据容器中；
当任意一个数据容器满时，按照其所处层级对应的编码方式，对其中的数据块进行编码，并将同一条带中的分块存储到不同的节点中；层级越高，对应的被引用次数范围越大，且对应的编码条带越短；
其中，N为大于1的正整数；条带中的分块为该条带内的数据块或校验块。

2.如权利要求1所述的基于去重系统的分层编码方法，其特征在于，还包括：
发生降级读时，从丢失数据块的元数据信息中提取被引用次数，以确定丢失数据块所处的层级，根据该层级对应的编码方式确定丢失数据块对应的解码方式；
获得所述丢失数据块所属的条带，遍历存储该条带中分块的节点，从其中k个未失效的节点中获取分块，并按照丢失数据块对应的解码方式对所获取的分块进行解码操作，以修复出丢失数据块；
其中，k为丢失数据块所属条带中数据块的数量。

3.如权利要求1或2所述的基于去重系统的分层编码方法，其特征在于，N＝3，相应地，数据块根据其被引用次数被划分为高、中、低三个层级。

4.一种基于去重系统的分层编码装置，其特征在于，包括：预处理模块、引用更新模块、分层存储模块以及分层编码模块；
所述预处理模块，用于预定义N-1个阈值，所定义的N-1个用于将数据块的被引用次...

【专利技术属性】
技术研发人员：胡燏翀，冯丹，刘振池，
申请(专利权)人：华中科技大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人