【技术实现步骤摘要】
用于在存储器管理中去重的参考块至参考集的聚合相关申请交叉引用本申请关联于美国专利申请第_号,提交于__,题为“pipelinedreferencesetconstructionanduseinmemorymanagement(管线参考集构造和在存储器管理中的使用)”;美国专利申请第_号,提交于__,题为“integrationofreferencesetswithsegmentflashmanagement(参考集与段闪存管理的集成)”;以及美国专利申请第_号,提交于__,题为“garbagecollectionforreferencesetsinflashstoragesystems(用于闪速存储系统中的参考集的垃圾收集)”,其每一个通过引用整体并入本文。
本公开涉及管理存储设备中数据块集。特别地,本公开描述了用于存储应用和数据去重的基于相似性的内容匹配。更特别地,本公开涉及将参考数据块聚合为参考数据集,用于闪存管理的去重。
技术介绍
基于相似性的内容匹配可应用于文档,用于标识文档集之间的相似性,与精确匹配相反。内容匹配的概念先前使用于搜索引擎实现和建立基于动态 ...
【技术保护点】
一种方法,包括:从数据存储中检索参考数据块;基于标准将参考数据块聚合为第一集;基于包括参考数据块的第一集的一部分生成参考数据集;以及在该数据存储中存储该参考数据集。
【技术特征摘要】
2015.11.04 US 14/932,8421.一种方法,包括:从数据存储中检索参考数据块;基于标准将参考数据块聚合为第一集;基于包括参考数据块的第一集的一部分生成参考数据集;以及在该数据存储中存储该参考数据集。2.根据权利要求1的方法,进一步包括:接收包括新数据块集的数据流;对新数据块集执行分析;基于该分析通过关联新数据块集与该参考数据集来编码新数据块集;以及更新记录表,该记录表将新数据块集的每个编码数据块关联于该参考数据集的对应参考数据块。3.根据权利要求2的方法,其中该分析包括标识新数据块集和该参考数据集之间是否存在相似性。4.根据权利要求2的方法,进一步包括:确定不同于该参考数据集的新集的数据块;将不同于该参考数据集的新集的数据块聚合为第二集;以及基于包括不同于该参考数据集的新数据块集的数据块的第二集而生成第二参考数据集。5.根据权利要求4的方法,进一步包括:分配使用计数变量至第二参考数据集;以及在该数据存储中存储第二参考数据集。6.根据权利要求1的方法,其中该标准包括关联于包含在该参考数据集中的多个参考数据块的预定义阈值。7.根据权利要求1的方法,其中该标准包括关联于要存储于该数据存储的多个参考数据集的阈值。8.一种系统,包括:处理器;以及存储器,其存储指令,当执行时使系统:从数据存储中检索参考数据块;基于标准将参考数据块聚合为第一集;基于包括该参考数据块的第一集的一部分来生成参考数据集;以及在该数据存储中存储该参考数据集。9.根据权利要求8的系统,进一步包括:接收包括新数据块集的数据流;对新数据块集执行分析;基于该分析通过关联新数据块集与该参考数据集来编码新数据块集;以及更新记录表,该记录表将新数据块集的每个编码数据块关联于该参考数据集的对应参考数据块。10.根据权利要求9的系统,其中该分析包括标识新数据块集和该参考数据集之间是否存在相似性。11.根据权利要求9的系统,...
【专利技术属性】
技术研发人员:A·辛盖,S·曼钱达,A·纳拉辛哈,V·卡拉姆切蒂,
申请(专利权)人:HGST荷兰公司,
类型:发明
国别省市:荷兰,NL
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。