一种热点数据识别方法及装置制造方法及图纸

技术编号：4217302 阅读：271 留言：0更新日期：2012-04-11 18:40

本发明专利技术实施例公开了一种热点数据识别方法及装置，包括：根据预置的第一统计表，获得当前周期内存储区域中的一级颗粒的周期访问频率加权平均值；当所述一级颗粒的周期访问频率加权平均值达到第一阈值时，将所述一级颗粒确定为热一级颗粒；将所述热一级颗粒划分为二级颗粒；在内存中创建第二统计表，所述第二统计表用于存储所述二级颗粒的信息；根据所述第二统计表，获得下一个周期内所述二级颗粒的周期访问频率加权平均值；当所述二级颗粒的周期访问频率加权平均值达到第二阈值时，将所述二级颗粒确定为热点数据区域，所述热点数据区域中的数据为热点数据。本发明专利技术实施例可以利用有限的内存空间完成对热点数据的识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及存储领域，尤其涉及一种热点数据识别方法及装置。
技术介绍
在计算机的使用过程中会产生大量数据，这些数据都需要被存储在磁盘上以备其他业务使用，许多业务在访问存储系统时，对随机IO并发性都有很高的要求。为满足业务应用的要求，提高存储系统的每秒钟处理IO请求(I/Oper second, IOPS)的能力，引入了热点数据迁移、二级缓存等新技术，而这些技术都依赖于热点数据识别技术。现有的热点数据识别技术主要包括，将存储区域划分为若干数据块，对所有数据块做精细化统计，统计若干块被访问的次数，根据被访问的次数计算被访问的频率，再根据块的被访问的频率判断其是否是热点数据区域。例如，以块的大小为32M为例，一个存储空间为2T的存储区域具有2T/32M = 64K个块，如果一个存储阵列同时存在2K个这样的存储区域，那么这个存储阵列的存储空间为2T*2K = 4P字节，假设块的管理单元是64字节，那么管理4P存储空间需要的统计信息空间为2K*64K*64 = 8G字节。这些统计信息是存放在高速介质上的，只有最近被访问的数据库的统计信息才会调入内存...

【技术保护点】
一种热点数据识别方法，其特征在于，包括：根据预置的第一统计表，获得当前周期内存储区域中的一级颗粒的周期访问频率加权平均值；当所述一级颗粒的周期访问频率加权平均值达到第一阈值时，将所述一级颗粒确定为热一级颗粒；将所述热一级颗粒划分为二级颗粒；在内存中创建第二统计表，所述第二统计表用于存储所述二级颗粒的信息；根据所述第二统计表，获得下一个周期内所述二级颗粒的周期访问频率加权平均值；当所述二级颗粒的周期访问频率加权平均值达到第二阈值时，将所述二级颗粒确定为热点数据区域，所述热点数据区域中的数据为热点数据。

【技术特征摘要】

【专利技术属性】
技术研发人员：董浩，龚涛，张翔，杜小华，
申请(专利权)人：成都市华为赛门铁克科技有限公司，
类型：发明
国别省市：90[中国|成都]

全部详细技术资料下载我是这个专利的主人