确定数据实体的访问特性的方法和存储控制器技术

技术编号:8801042 阅读:176 留言:0更新日期:2013-06-13 05:43
本发明专利技术涉及确定数据实体的访问特性的方法和存储控制器。在确定数据实体的特性的方法中,提供持续一段时间间隔有效的计数布隆过滤器(CBF1),所述特性基于对存储系统中的所述数据实体的访问频率,所述计数布隆过滤器(CBF1)包含一组(S1)计数器(C1),并提供一种包含一组元素的数据结构。在所述时间间隔期间每次所述数据实体被访问时,增大所述数据实体在所述计数布隆过滤器(CBF1)中被映射到的计数器(C1)的子集中的至少一个计数器(C1)的值。对于与计数器的子集相关联的元素的子集中的至少一个元素,以在时间间隔结束时与所述元素相关联的计数器的值为条件,并以所述元素的当前值为条件,确定新的值。以元素的子集当中的至少一个元素的新值为条件,确定所述数据实体的特性。

【技术实现步骤摘要】

本专利技术涉及确定数据实体的特性的方法和存储控制器,所述特性基于对存储系统中的所述数据实体的访问频率。
技术介绍
下面,数据实体的代表该数据实体被访问的频率的特性在相对基础上也被表示成这种数据实体的温度。确定特定数据实体(尤其包括其逻辑地址)的温度是存储系统中的一项长期存在的挑战。特定数据实体的温度指的是它的相对引用频率,所述引用可包括对其在同一个存储系统中的对等体的读取或写入访问。整个存储系统的温度信息的集合也被称为热图。如果数据实体被频繁地访问,那么该数据实体通常被称为“热”,或者如果数据实体很少被访问,那么该数据实体通常被称为“冷”。温度可以定量地测量对数据实体的访问有多频繁和有多近。确定数据实体的温度的一种简单、直接的方式是使用用于每个数据实体的计数器来跟踪引用次数。然而,对于大容量存储系统来说,这是存储效率低的。为了缩小热图的内存占用,一种流行的解决方案是把一个计数器用于一组邻接的数据实体,即,以较粗的粒度来跟踪数据的温度。
技术实现思路
按照本专利技术的第一方面,提供一种确定数据实体的特性的方法,所述特性基于对存储系统中的所述数据实体的访问频率。提供持续一段时间间隔工作的计数布隆过滤器(bloomfilter),所述计数布隆过滤器包含一组计数器。提供一种数据结构,所述数据结构包含一组元素,其中所述一组元素中的每个元素被分配给所述一组计数器中的计数器。以所述一组元素中的至少一个元素的值为条件,确定所述数据实体的特性。对于所述计数布隆过滤器工作的每个单独时间间隔,-在所述单独时间间隔之前或者在所述单独时间间隔的开始,所述一组计数器中的各个计数器被重置,-在所述单独时间间隔期间,每次所述数据实体被访问时,增大所述数据实体在所述计数布隆过滤器中被映射到的计数器子集中的至少一个计数器的值,和-在所述单独时间间隔的结束或者在所述单独时间间隔结束之后,更新所述一组元素中的每个单独元素的值,其中,以分配给所述单独元素的计数器在所述单独时间间隔结束时保持的值为条件,并以所述单独元素的当前值为条件,更新所述单独元素的值。在实施例中,所述方法包含以下特征中的一个或多个特征:-使计数布隆过滤器在相继的时间间隔工作多次;-以分配给所述单独元素的计数器在所述单独时间间隔结束时保持的加权值为条件,并以所述单独元素的加权当前值为条件,更新所述单独元素的值;-所述单独元素的值是用利用因子α加权的分配给所述单独元素的计数器在单独时间间隔结束时保持的值加上利用因子l-α加权的所述单独元素的当前值来更新的;-因子α具有在0.75和0.95之间的值;-所述数据实体借助于一个或多个散列函数被映射到所述计数器子集;-所述计数器子集包含所述数据实体在计数布隆过滤器中被映射到的多个计数器,其中,只有该子集中的单个计数器的值被增大,所述单个计数器是所述子集中的所述多个计数器当中当前显示最小值的计数器;-所述一组元素中的每个元素被分配给所述一组计数器中的单个计数器,其中,所述一组计数器中的每个计数器被分配给所述一组元素中的单个元素;-计数器的子集包含所述数据实体在计数布隆过滤器中被映射到的多个计数器,元素的子集包含被分配给计数器的子集的各个计数器的元素,以及以元素的子集中的一个或多个元素的值为条件,确定所述数据实体的特性;-以元素的子集中的多个元素当中显示最小值的元素的值为条件,确定所述数据实体的特性;-访问所述数据实体包括读取所述数据实体和更新所述数据实体中的至少一个;-所述数据实体代表用单个逻辑块地址寻址的数据;-以确定的所述数据实体的特性为条件,选择所述数据实体以便被高速缓存;-以确定的所述数据实体的特性为条件,选择所述数据实体,以便保存在分层存储系统中的指定层中。按照本专利技术的第二方面,提供一种确定数据实体的特性的方法,所述特性基于对存储系统中的所述数据实体的访问频率。提供在第一时间间隔内有效的第一计数布隆过滤器,所述第一计数布隆过滤器包含一组第一计数器。在第一时间间隔期间每次所述数据实体被访问时,增大所述数据实体在第一计数布隆过滤器中被映射到的第一计数器的子集中的至少一个第一计数器的值。提供在第二时间间隔内有效的第二计数布隆过滤器,所述第二计数布隆过滤器包含一组第二计数器。在第二时间间隔期间每次所述数据实体被访问时,增大所述数据实体在第二计数布隆过滤器中被映射到的第二计数器的子集中的至少一个第二计数器的值。以在第一时间间隔结束时第一计数器的子集中的至少一个第一计数器的值为条件,并以在第二时间间隔结束时第二计数器的子集中的至少一个第二计数器的值为条件,确定数据实体的特性。在实施例中,所述方法可包括以下特征中的一个或多个特征:-提供全部η个计数布隆过滤器,所述η个计数布隆过滤器中的每一个在相关时间间隔内有效,所述相关时间间隔彼此相随;在相关时间间隔期间每次所述数据实体被访问时,依照第一或第二计数布隆过滤器使η个计数布隆过滤器中的每一个工作;以对于η个计数布隆过滤器中的每个计数布隆过滤器,在相关时间间隔结束时相应计数布隆过滤器中与所述数据实体相关联的计数器的子集中的至少一个计数器的值为条件,确定所述数据实体的特性;-根据从η个计数布隆过滤器中选择的计数器值的平均值来确定所述数据实体的特性;-借助于一个或多个散列函数,所述数据实体被映射到第一计数器的子集,以及借助于相同的一个或多个散列函数,所述数据实体被映射到第二计数器的子集;-第一计数器的子集包含所述数据实体在第一计数布隆过滤器中被映射到的多个第一计数器;只有该子集中的单个第一计数器的值被增大,所述单个第一计数器是该述子集中的多个第一计数器当中当前显示最小值的第一计数器;以及第二计数器的子集包含第二计数布隆过滤器中所述实体被映射到多个第二计数器;只有该子集中的单个第二计数器的值被增大,所述单个第二计数器是该子集中的多个第二计数器当中当前显示最小值的第二计数器;-第一计数器的子集包含第一计数布隆过滤器中所述数据实体被映射到的多个第一计数器,第二计数器的子集包含所述数据实体在第二计数布隆过滤器中被映射到的多个第二计数器;以第一计数器的子集中的指定第一计数器的值为条件,并以第二计数器的子集中的指定第二计数器的值为条件,确定所述数据实体的特性,所述指定第一计数器是在第一时间间隔结束时,第一计数器的子集中的多个第一计数器当中显示最小值的第一计数器,所述指定第二计数器是在第二时间间隔结束时,第二计数器的子集中的多个第二计数器当中显示最小值的第二计数器;-访问所述数据实体包括读取所述数据实体和更新所述数据实体中的至少一个;-所述数据实体代表用单个逻辑块地址寻址的数据;-以确定的所述数据实体的特性为条件,选择所述数据实体以便高速缓存;-以确定的所述数据实体的特性为条件,选择所述数据实体以便保存在分层存储系统中的指定层中。本专利技术的另一个方面涉及一种包含计算机可读介质的计算机程序产品,所述计算机可读介质包含有计算机可读程序代码,该计算机可读程序代码包含被配置成执行按照前述各个方面或实施例任意之一的方法的计算机可读程序代码。本专利技术的另一个方面涉及一种用于确定数据实体的特性的存储控制器,所述特性基于对存储系统中的所述实体的访问频率,所述存储控制器包含适合于执行按照前述各个方面或实施例任意之一的方法的控制单元。本文档来自技高网...

【技术保护点】
一种确定数据实体的特性的方法,所述特性基于对存储系统中的所述数据实体的访问频率,所述方法包括:提供持续一段时间间隔工作的计数布隆过滤器(CBF1),所述计数布隆过滤器(CBF1)包含一组(S1)计数器(C1),提供一种数据结构,所述数据结构包含一组元素,其中所述一组元素中的每个元素被分配给所述一组计数器中的计数器,以所述一组元素中的至少一个元素的值为条件,确定所述数据实体的特性,其中,对于所述计数布隆过滤器工作的每个单独时间间隔,?在所述单独时间间隔之前或者在所述单独时间间隔开始时,所述一组计数器中的各个计数器被重置,?在所述单独时间间隔期间,每次所述数据实体被访问时,增大所述数据实体在所述计数布隆过滤器(CBF1)中被映射到的计数器(C1)子集中的至少一个计数器(C1)的值,?在所述单独时间间隔结束时或者在所述单独时间间隔结束之后,更新所述一组元素中的每个单独元素的值,其中,以分配给所述单独元素的计数器在所述单独时间间隔结束时保持的值为条件,并以所述单独元素的当前值为条件,更新所述单独元素的值。

【技术特征摘要】
2011.07.26 EP 11175348.91.一种确定数据实体的特性的方法,所述特性基于对存储系统中的所述数据实体的访问频率,所述方法包括: 提供持续一段时间间隔工作的计数布隆过滤器(CBF1),所述计数布隆过滤器(CBF1)包含一组(S1)计数器(C1), 提供一种数据结构,所述数据结构包含一组元素,其中所述一组元素中的每个元素被分配给所述一组计数器中的计数器, 以所述一组元素中的至少一个元素的值为条件,确定所述数据实体的特性, 其中,对于所述计数布隆过滤器工作的每个单独时间间隔, -在所述单独时间间隔之前或者在所述单独时间间隔开始时,所述一组计数器中的各个计数器被重置, -在所述单独时间间隔期间,每次所述数据实体被访问时,增大所述数据实体在所述计数布隆过滤器(CBF1)中被映射到的计数器(C1)子集中的至少一个计数器(C1)的值, -在所述单独时间间隔结束时或者在所述单独时间间隔结束之后,更新所述一组元素中的每个单独元素的值,其中,以分配给所述单独元素的计数器在所述单独时间间隔结束时保持的值为条件,并以所述单独元素的当前值为条件,更新所述单独元素的值。2.按照权利要求1所述的方法, 其中,使计数布隆过滤器在连续的时间间隔工作多次。3.按照权利要求1或2所述的方法, 其中,以分配给所述单独元素的计数器在所述单独时间间隔结束时保持的加权值为条件,并以所述单独元素的加权当前值为条件,更新所述单独元素的值。4.按照权利要求3所述的方法, 其中,所述单独元素的值是用利用因子α加权的分配给所述单独元素的计数器在所述单独时间间隔结束时保持的值加上利用因子l-α加权的所述单独元素的当前值来更新的。5.按照权利要求4所述的方法, 其中,因子α具有在0.75和0.95之间的值。6.按照前述权利要求任意之一所述的方法, 其中,所述数据实体借助于一个或多个散列函数(h)被映射到所述计数器(C1)子集。7.按照前述权利要求任意之一所述的方法, 其中,所述计数器(C1)子集包含所述数据实体在计数布隆过滤器(CBF1)中被映射到的多个计数器(C1),以及其中,只有该子集中的单个计数器(C1)的值被增大,所述单个计数器(C1)是所述子集中的所述多个计数器(C1)当中当前显示最小值的计数器(C1)。8.按照前述权利要求任意之一所述的方法, 其中,所述一组元素中的每个元素被分配给所述一组计数器中的单个计数器,以及其中,所述一组计数器中的每个计数器被分配给所述一组元素中的单个元素。9.按照前述权利要求任意之一所述的方法, 其中,所述计数器(C1)子集包含所述数据实体在计数布隆过滤器(CBF1)中被映射到的多个计数器(CBF1), 其中,元素的子集包含被分配给计数器的子集的各个计数器的元素,以及其中,以元素的子集中的一个或多个元素的值为条件,确定所述数据实体的特性。10.按照权利要求9所述的方法, 其中,以元素的子集中的多个元素当中显示最小值的元素的值为条件,确定所述数据实体的特性。11.一种确定数据实体的特性的方法,所述特性基于对存储系统中的所述数据实体的访问频率,所述方法包括: 提供在第一时间间隔内有效的第一计数布隆过滤器(CBF1),所述第一计数布隆过滤器(CBF1)包含一组(S1)第一计数器(C1), 在第一时间间隔期间每次所述数据实体被访问时,增大所述数据实体在第一计数布隆过滤器(CBF1)中被映射到的第一计数器(C1)的子集中的至少一个第一计数器(C1)的值, 提供在第二时间间隔内有效的第二计数布隆过滤器(CBF2),所述第二计数布隆过滤器(CBF2)包含一组(S2)第二计数器(C2), 在第二时间间隔期间每次所述数据实体被访问时,增大所述数据实体在第二计数布隆过滤器...

【专利技术属性】
技术研发人员:胡晓宇I·科特斯达斯R·普莱卡R·哈斯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1