【技术实现步骤摘要】
本专利技术涉及计算机数据存储管理领域,特别是涉及一种基于云计算环境中的应用感知的大数据重复删除存储系统及方法。
技术介绍
在数字世界中,数据容量和复杂度爆炸式增长。国际数据公司IDC(International Data Corporation)研究表明:在过去的五年里,数据年增长量翻9倍达到7ZB,并且在未来的十年内,将增长44倍达到35ZB。企业的数字信息量也很容易上升到PB级甚至EB级。由于大数据时代数据量的不断增长使得管理变得越来越复杂,数据管理成本和数据丢失风险提高。随着存储系统的不断扩展,不仅需要消耗数据中心更多的数据存储空间、能耗和制冷代价,也需要增加大量的管理时间和提高操作复杂度和人为出错风险。同时,由于现代存储系统对高性能的需求,内存正在取代磁盘,而磁盘在取代磁带。为满足大数据管理所需的服务级别协议(Service Level Agreement,SLA),管理存储介质变化下的数据泛滥成了新的挑战。重复数据删除(简称重删)存储技术被广泛应用于磁盘存储系统来管理海量的备份、归档文件和虚拟机镜像等数据,利用存储数据集中高度数据冗余的特性来节省存储容量需求和提高网络带宽利用率。为满足大数据存储在容量和性能方面的可扩展需求,基于云计算环境的分布式重复数据删除存储系统被应用于海量存储数据集的管理,以获得高重删压缩比和高重删吞吐率。分布式重复数据删除存储系统通常具有将应用数据从客户端分配到多个重复数据删除服务器节点(简称重删节点)的数据路由机制,以及在每一个重删节点内进行独立重复数据删除和存储的过程。为及时删除重复数据、优化数据存储和传输开销,需要 ...
【技术保护点】
一种应用感知的大数据重复删除存储系统,包括基于计算机网络互联的客户端、管理服务器和重删节点,其特征在于:所述客户端包括数据划分模块、指纹计算模块和相似感知数据路由模块,所述数据划分模块用于对应用文件按照固定长度或可变长度划分为数据块,再进一步将所述数据块组合成超块;所述指纹计算模块利用抗冲突加密哈希函数计算所述超块中的每一个数据块的指纹,得到所述超块对应的各数据块的指纹列表;所述相似感知数据路由模块利用相似感知路由方法为所述超块确定一个用于存储所述超块的目标重删节点;所述管理服务器包括文件会话管理模块和应用感知路由决策模块,所述文件会话管理模块用于存储所述应用文件与所述应用文件划分的数据块的指纹之间的映射关系,以及需要重构所述应用文件的元数据信息;所述应用感知路由决策模块与所述相似感知数据路由模块之间通过应用感知路由方法,为所述应用文件确定一组用于存储所述应用文件的超块的重删节点列表,并反馈给所述客户端;所述重删节点包括应用感知相似索引查询模块、块指纹缓存模块以及并行容器管理模块,所述应用感知相似索引查询模块用于向所述客户端反馈应用感知相似性索引查询结果,所述块指纹缓存模块用于缓存最近 ...
【技术特征摘要】
1.一种应用感知的大数据重复删除存储系统,包括基于计算机网络互联的客户端、管理服务器和重删节点,其特征在于:所述客户端包括数据划分模块、指纹计算模块和相似感知数据路由模块,所述数据划分模块用于对应用文件按照固定长度或可变长度划分为数据块,再进一步将所述数据块组合成超块;所述指纹计算模块利用抗冲突加密哈希函数计算所述超块中的每一个数据块的指纹,得到所述超块对应的各数据块的指纹列表;所述相似感知数据路由模块利用相似感知路由方法为所述超块确定一个用于存储所述超块的目标重删节点;所述管理服务器包括文件会话管理模块和应用感知路由决策模块,所述文件会话管理模块用于存储所述应用文件与所述应用文件划分的数据块的指纹之间的映射关系,以及需要重构所述应用文件的元数据信息;所述应用感知路由决策模块与所述相似感知数据路由模块之间通过应用感知路由方法,为所述应用文件确定一组用于存储所述应用文件的超块的重删节点列表,并反馈给所述客户端;所述重删节点包括应用感知相似索引查询模块、块指纹缓存模块以及并行容器管理模块,所述应用感知相似索引查询模块用于向所述客户端反馈应用感知相似性索引查询结果,所述块指纹缓存模块用于缓存最近频繁访问的数据块的指纹,以加速对数据块的查询处理,所述并行容器管理模块用于以并行处理的方式存储唯一数据块。2.根据权利要求1所述的应用感知的大数据重复删除存储系统,其特征在于,所述抗冲突加密哈希函数包括MD5、SHA-1和/或SHA-2函数。3.根据权利要求2所述...
【专利技术属性】
技术研发人员:付印金,谢钧,陈卫卫,缪嘉嘉,赵洪华,端义锋,
申请(专利权)人:中国人民解放军理工大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。