The invention discloses a method and a device for extracting articles, belonging to the field of information technology so as to save storage space in the process of obtaining entries with high access frequency. The method includes: from the first sampling period until the end of a sampling period before a sampling period, perform the following steps: A. get the current sampling period of each item visits; B. according to the current sampling period of each item access times, the average value of determining the entry access the current sampling period; C. removal of the number is less than the average value of the entry access period of the current sampling, and the number of visits is not less than the average value of the items as the items the next sampling period; repeat steps a to C, until the next sampling period for the last sampling period; current a sampling period for the last sample period, according to the number of visits from high to low in order to extract the specified items in the last sampling period. The invention is used for item extraction.
【技术实现步骤摘要】
一种条目提取方法和装置
本专利技术涉及信息
,特别涉及一种条目提取方法和装置。
技术介绍
在大规模表存储结构中,经常需要获取访问频率高的一些条目,例如,最经常访问的前8个条目,以对条目进行分析和进行控制操作。相关技术中,为获取访问频率最高的一些条目,通常为每一个条目增加一个计数器和一个初始计数记录,在指定的时间后观察统计每一个条目的初始计数与当前计数之间的计数差值,进行排序后取得访问频率最高的前N(例如,10个)个条目。但是,这种获取访问频率高的条目的方法会耗费极大的存储空间。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种条目提取方法和装置,以在获取访问频率高的条目的过程中节省存储空间。一方面,提供一种条目提取方法,其特征在于,所述方法包括:从第一个采样周期开始直到最后一个采样周期的前一个采样周期,执行以下步骤:a.获取当前采样周期内对各个条目的访问次数;b.根据所述当前采样周期内对各个条目的访问次数,确定所述当前采样周期内条目访问的平均值;c.移除所述当前采样周期内访问次数小于所述平均值的条目,并将访问次数不小于所述平均值的条目作为下一采样周期内的条目;d.确定下一采样周期是否为最后一个采样周期;若下一采样周期不为最后一个采样周期,重复步骤a~d,直到下一采样周期为最后一个采样周期;当下一采样周期为最后一个采样周期时,按照访问次数从高到低的顺序提取最后一个采样周期中的指定个条目。可选地,在一个实施例中,所述方法还包括:确定提取的所述指定个条目中的各个条目的访问次数是否超过阈值;将提取的所述指定个条目中超过阈值的条目封锁指定时间。可选 ...
【技术保护点】
一种条目提取方法,其特征在于,所述方法包括:从第一个采样周期开始直到最后一个采样周期的前一个采样周期,执行以下步骤:a.获取当前采样周期内对各个条目的访问次数;b.根据所述当前采样周期内对各个条目的访问次数,确定所述当前采样周期内条目访问的平均值;c.移除所述当前采样周期内访问次数小于所述平均值的条目,并将访问次数不小于所述平均值的条目作为下一采样周期内的条目;d.确定下一采样周期是否为最后一个采样周期;若下一采样周期不为最后一个采样周期,重复步骤a~d,直到下一采样周期为最后一个采样周期;当下一采样周期为最后一个采样周期时,按照访问次数从高到低的顺序提取最后一个采样周期中的指定个条目。
【技术特征摘要】
1.一种条目提取方法,其特征在于,所述方法包括:从第一个采样周期开始直到最后一个采样周期的前一个采样周期,执行以下步骤:a.获取当前采样周期内对各个条目的访问次数;b.根据所述当前采样周期内对各个条目的访问次数,确定所述当前采样周期内条目访问的平均值;c.移除所述当前采样周期内访问次数小于所述平均值的条目,并将访问次数不小于所述平均值的条目作为下一采样周期内的条目;d.确定下一采样周期是否为最后一个采样周期;若下一采样周期不为最后一个采样周期,重复步骤a~d,直到下一采样周期为最后一个采样周期;当下一采样周期为最后一个采样周期时,按照访问次数从高到低的顺序提取最后一个采样周期中的指定个条目。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定提取的所述指定个条目中的各个条目的访问次数是否超过阈值;将提取的所述指定个条目中超过阈值的条目封锁指定时间。3.根据权利要求1所述的方法,其特征在于,在步骤c之后,所述方法还包括:针对当前采样周期,确定访问次数不小于所述平均值的条目中的各个条目的访问次数是否超过阈值;将访问次数超过阈值的条目进行封锁。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:当封锁的条目数目达到指定的条目数目的情况下,对于后续各个采样周期,将后续各个采样周期内需要封锁的条目进行封锁,同时将已封锁的条目中的至少一个条目进行解封锁;其中,封锁的条目数目等于解封锁的条目数目;其中,所述需要封锁的条目为访问次数超过所述阈值的条目;其中,在进行条目封锁时,按照访问次数从高到低的顺序选取条目进行封锁;在进行条目解封锁时,按照访问次数从低到高的顺序或者按照封锁时间从先到后的顺序进行解封锁。5.根据权利要求1-4任一所述的方法,其特征在于,所述方法还包括:以固定大小的存储空间存...
【专利技术属性】
技术研发人员:刘京洋,
申请(专利权)人:广州华多网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。