【技术实现步骤摘要】
本专利技术涉及存储技术,更具体地说,涉及在存储设备间进行数据迁移的方法和设备。
技术介绍
大型存储系统往往由不同类型的存储设备构成。这些不同类型的存储设备在价格和性能上具有显著的差异。例如,从ー个毎分钟转速15000的硬盘举动器HDD中读取ー份数据需要的平均响应时间是10毫秒,而从ー个固态硬盘SSD中直接读取该数据需要的平均响应时间小于I毫秒。由于高速存储设备的造价高于低速存储器,系统中高速存储设备的数据容量小于低速存储器的数据容量。因此,只有一部分数据才会被存储在高速存储设备中。假设在存储系统中,数据的最小单位是数据块;多个数据块组成数据卷;应用程序请求ー个或多个数据卷。可以根据数据被访问的频繁程度来确定哪些数据需要被存储在高速存储设备中,从而将这些数据从低速存储设备迁移到高速存储设备。本领域技术人员可以理解,这里的数据块和数据卷都是逻辑概念,而不是物理概念。换句话说,ー个数据卷或者ー个数据块的数据,可能被存储在多个物理存储设备上。因此,这种迁移对于使用这些数据的应用程序来说是透明的。可以根据某数据块被访问的频率以及访问该数据块时的响应时间来确定某个数据块是否 ...
【技术保护点】
一种用于在存储设备间进行数据迁移的方法,该方法包括:收集低速存储设备中的数据卷的负载参数的原始时域序列;基于所收集的负载参数的原始时域序列,估计数据卷的负载周期;以及根据估计得到的负载周期迁移数据卷的数据,使得在数据卷的负载峰值期间,所述数据位于高速存储设备中。
【技术特征摘要】
1.一种用于在存储设备间进行数据迁移的方法,该方法包括: 收集低速存储设备中的数据卷的负载參数的原始时域序列; 基于所收集的负载參数的原始时域序列,估计数据卷的负载周期;以及根据估计得到的负载周期迁移数据卷的数据,使得在数据卷的负载峰值期间,所述数据位于高速存储设备中。2.按权利要求1所述的方法,其中基于所收集的负载參数的原始时域序列估计数据卷的负载周期包括: 对所述负载參数的原始时域序列进行时频变换以得到所述负载參数的频域特性;以及 根据所述负载參数的频域特性估计数据卷的负载周期。3.按权利要求2所述的方法,进ー步包括: 在对所述负载參数的原始时域序列进行时频变换前,从所述负载參数的原始时域序列中去除线性分量。4.按权利要求1所述的方法,其中根据估计得到的负载周期迁移数据卷的数据包括: 迁移所述数据卷中热点数据块的数据。5.按权利要求1或4所述的方法,其中根据估计得到的负载周期迁移数据卷的数据包括: 在需要迁移多个数据卷的数据的情况下,优先对优先级高的数据卷进行所述迁移。6.根据权利要求1所述的方法,其中收集低速存储设备中的数据卷的负载參数的原始时域序列包括: 收集多个数据卷的负载參数的原始时域序列; 其中基于所收集的负载參数的原始时域序列估计数据卷的负载周期包括: 对所述多个数据卷的负载參数的原始时域序列进行聚类操作,使得类似的原始时域序列被归入同一个类别中; 针对各类别估计负载周期,并将所估计的负载周期应用于该类别中的各原始时域序列所对应的数据卷。7.按权利要求2所述的方法,其中根据所述负载參数的频域特性估计所述数据卷的负载周期包括: 根据所述频域特性,选择功率大于频率阈值的频率分量;和 根据所选择的频率分量估计所述数据卷的负载周期。8.按权利要求2所述的方法,其中根据所述负载參数的频域特性估计所述数据卷的负载周期包括: 选择尽可能少的频率分量,使得恢复时域序列与原始时域序列的误差小于误差阈值,其中所述恢复时域序列是根据所选择的频率分量进行频时变换后得到的时域序列;和根据所选择的频率分量估计所述数据卷的负载周期。9.按权利要求2所述的方法,其中根据所述负载參数的频域特性估计所述数据卷的负载周期包括: 选择尽可能多的频率分量,使得根据所选择的频率分量预估的周期小于所述周期阈值;和 根据所选择的频率分量估计所述数据卷的负载周期。10.根据权利要求1所述的方法,进ー步包括: 将所述数据从高速存储设备迁移回低速存储设备。11.一种用于在存储设备间进行...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。