一种基于文件语义和系统实时状态的冗余数据去重方法技术方案

技术编号：12350462 阅读：399 留言：0更新日期：2015-11-19 01:31

本发明专利技术公开了一种基于文件语义和系统实时状态的冗余数据去重方法，该方法主要由三个功能模块实现：基于多语义维度划分的去重优先度计算模块(MPD模块)、分层级的数据去重模块(去重器)以及基于系统实时状态的去重控制模块(控制器)。MPD模块基于多维度的文件语义，输出优先进行去重操作的文件对象，去重器则根据以上输出依次执行分层级的，包含全局文件层面去重以及本地基于数据块层面去重的去重策略；同时在去重器的运作过程当中，控制器会根据系统的实时状态，对去重器进行动态调整，从而在保证分布式主存储系统的读请求响应性能的同时，节省更多的存储空间成本开销。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机信息管理
，具体涉及一种基于文件语义和系统实时状态的冗余数据去重方法。
技术介绍
随着云计算和移动互联网的进一步普及和深入应用，各类网上应用和服务正在各行各业中扮演着更为重要的角色，而随着互联网应用的用户基数急剧上升，全球的信息总量也正在以爆炸性的速度在增长。分布式存储系统是各类云服务的后台支撑系统，所有的服务数据都存储在分布式存储系统当中，存储系统对外提供统一的读写接口，以便用户或上层应用服务访问或修改存于磁盘当中的数据。对应不同的应用场景和主要用途，分布式存储系统又可以从粗粒度上划分为两类：备份存储系统和主存储系统。备份存储系统主要应用于冷数据的备份，如系统日志、历史档案等等，这些备份系统一般搭建在造价相对低廉的存储硬件设备上，甚至是可以基于磁带存储的底层存储设备，因为备份存储系统当中的数据的访问热度非常地低，一般只会在有特殊需求时才会将历史数据读取出来，因此备份存储系统对数据的读写性能没有太高的要求。相比之下，主存储系统，一般指的是存储了上层应用服务会直接访问的数据的系统，则对于数据的访问性能有着较高的要求，因为在读写的高效性直接决定了用户对于上层应用和服务的体验。主存储系统通常都是以数据块为基本单位，将文件分为一个个数据块存储在底层的磁盘当中，然后在主存储系统的内存当中维护着一份关于所有数据块的索引，索引的目的是为了记录数据块所从属的文件的信息，以及数据块在磁盘上的物理位置。由于主存储系统需要有较高的数据访问性能，因此在分布式的环境下，系统开发者通常会设定一套具有冗余特性的数据...
一种基于文件语义和系统实时状态的冗余数据去重方法

【技术保护点】
一种基于文件语义和系统实时状态的冗余数据去重方法，如下：周期性的检测分布式存储系统的读响应时延和去重比率；根据当前时刻系统的读响应时延和去重比率，采用以下基于SLA动态调节机制对系统的去重器进行调节：根据系统当前所参照的SLA，判断当前时刻系统的读响应时延是否大于该SLA读响应时延区间上限的1.1倍：若是，则使去重器在下一周期内对系统停止执行GFD和LCD；若否，判断当前时刻系统的读响应时延是否小于该SLA的读响应时延区间上限：若否，则使去重器在下一周期内对系统保留执行GFD，停止执行LCD；若是，判断当前时刻系统的去重比率是否小于该SLA的去重比率区间下限：若是，则使去重器在下一周期内对系统正常执行GFD和LCD；若否，则使系统当前所参照的SLA提升一个等级，并根据新的SLA按照上述动态调节机制重新进行判断。

【技术特征摘要】

【专利技术属性】
技术研发人员：尹建伟，唐彦，邓水光，李莹，吴健，吴朝晖，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人