一种硬盘阵列扫描频率计算方法技术

技术编号:26923671 阅读:18 留言:0更新日期:2021-01-01 22:47
本发明专利技术公开了一种硬盘阵列扫描频率计算方法,过程为:确定硬盘失效时间的概率分布函数;硬盘故障时,存储系统的数据丢失代价正比于故障开始到当前的时间,比例系数为Lc,表示单位时间内的数据丢失代价;确定硬盘的平均无故障时间MTBF值;硬盘扫描检测时,时刻t付出代价的数学期望值;对于N个硬盘的RAID阵列,得到RAID位错率;得到单个RAID阵列组的失效率以及整个存储系统的失效率;确定容单盘错存储系统的扫描检测次数,基于系统代价的最小化目标得到硬盘阵列系统的扫描频率需求。本发明专利技术综合了硬盘扫描影响的各个因素,并对影响程度进行了量化;面向最优代价目标,根据不同硬盘系统指标评价确定扫描频率的数值计算结果。

【技术实现步骤摘要】
一种硬盘阵列扫描频率计算方法
本专利技术属于数据存储
,涉及一种基于扫描代价的硬盘阵列扫描频率计算方法。
技术介绍
为了提高硬盘可靠性,可以通过解决硬盘上的潜在扇区错误来降低硬盘设备出错的概率。一种常见的方法是硬盘扫描检测技术,是指在正常读写访问之外通过特定命令下发读取硬盘数据,通过IO读取数据,可以找到无法读出数据的坏道,进行Remap重映射,将数据重新写到硬盘空闲区域,进而保护数据。然而,随着数据阵列存储系统容量的不断增加,过多的扫描会影响存储系统的性能,而太少的扫描由会导致可靠性的降低。为了尽可能的减少对前端用户的影响,扫描检测操作一般作为低优先级的进程来运行。在存储系统的整个生命周期内,每次扫描检测的时间对于存储系统的生命周期来说,仍然非常短。而且在硬盘的整个生命周期内,可能需要进行许多次的硬盘扫描检测操作。触发硬盘扫描检测的时机一般有两种情况:定期启动、随机启动。如果考虑硬盘扫描检测对系统的可靠性、性能、能耗这几方面的影响,那么,选择一个合适的硬盘阵列扫描检测周期则成为一个值得研究的问题。
技术实现思路
(一)专利技术目的本专利技术的目的是:提供一种基于扫描代价的硬盘阵列扫描频率计算方法,把扫描检测操作中所涉及的各方面因素都进行代价的数值量化。(二)技术方案为了解决上述技术问题,本专利技术提供一种硬盘阵列扫描频率计算方法,该方法基于如下几点设定:(1)硬盘失效时间的概率分布函数为F(t),概率密度函数为f(t),硬盘的寿命为T,那么(2)有硬盘故障时,存储系统的数据丢失代价正比于故障开始到当前的时间,比例系数为Lc,表示单位时间内的数据丢失代价。该比例值可以由如下公式得到:Lc=K*r(t)。K代表存储在硬盘中的每个数据记录的价值,r(t)为硬盘的失效率,定义如下:(3)假设两个相邻扫描检测间隔期间的硬盘失效率服从均匀分布。对于硬盘的寿命来说,扫描检测的周期值非常小,在某个时间段内,硬盘的MTBF值(平均无故障时间)是一个常数。(4)一次扫描检测的代价为Sc;单位时间内的扫描检测次数为n(t),时刻t时总的扫描检测次数为在整个存储系统的运行过程中,某一时刻t可能付出代价的数学期望值表示为如下公式:为了使得E(t)达到最小,即总的期望代价达到最小的检查次数函数,需要满足:也就是说,当扫描检测的周期满足这个公式时,整个存储系统在可靠性方面付出的代价具有最小值。对于常见的N个硬盘的RAID阵列来说,可以至少接收一个盘出错。可以得到RAID(发生BER的概率)位错率为:Pf=(N-1)·SBER·Cdisk其中,N为RAID阵列组中硬盘的个数,Cdisk为单盘的容量,SBER为硬盘的潜在扇区失效率,一般情况下,SATA盘的潜在扇区失效率为10-14,SCSI盘的潜在扇区失效率为10-15。容单盘错的RAID系统(例如RAID1,RAID10,RAID5等)的MTTDL(平均数据丢失时间)为MTBF的函数:MTTDLRAID=MTBF/(N·Pf)由可靠性理论,可得到单个RAID阵列组的失效率为:r(t)D为单个硬盘的失效率。如果整个系统共有M个硬盘组成阵列,那么整个存储系统的失效率为:容单盘错存储系统的扫描检测次数应该满足如下公式:通过上述评价方法,即可基于系统代价的最小化目标得到硬盘阵列系统的扫描频率需求。(三)有益效果上述技术方案所提供硬盘阵列扫描频率计算方法,有益效果在于:1、综合了硬盘扫描影响的各个因素,并对影响程度进行了量化;2、面向最优代价目标,根据不同硬盘系统指标评价确定扫描频率的数值计算结果。具体实施方式为使本专利技术的目的、内容和优点更加清楚,下面结合实施例,对本专利技术的具体实施方式作进一步详细描述。基于本专利技术的计算方法和公式,结合常见实际应用可以给出如下计算流程。假设存储系统中有1000个硬盘,每个RAID由5个硬盘组成,那么存储系统中有200个RAID组。每个硬盘的容量为120G,根据Pf的定义,可知Pf=(5-1)×120G×10-14/bit=0.384普通硬盘的带宽假设为60MB/s-70MB/s,假设硬盘一失效就被发现,那么重建失效硬盘所需要的时间为120GB/(60MB/s-70MB/s)≈30(分钟),也就是说,MTTR=30(分钟),因此可以认为在1小时内的修复率μ=1。已有的数据分析指出,硬盘的年失效率r(t)在1.7%到8.5%之间,有时候甚至会更高。一般来说,每度电0.4-0.8元,读硬盘的速度为60M/s-70M/s,硬盘的功率一般为13w左右,所以扫描检测一个120GB的硬盘所需时间为5/9个小时(120000/60*60*60),一个有1000个硬盘的数据中心扫描检测一次所需要的电费约是0.013×0.6×1000×5/9=4.3元,那么Sc=4.3。按照本专利技术方法及上述数据计算,最终得到不同的数据丢失代价和硬盘失效率情况下的硬盘扫描频率如下表1所示。表1容单盘错阵列扫描频率参考值(次/年)以上所述仅是本专利技术的优选实施方式,应当指出,对于本
的普通技术人员来说,在不脱离本专利技术技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本专利技术的保护范围。本文档来自技高网
...

【技术保护点】
1.一种硬盘阵列扫描频率计算方法,其特征在于,过程如下:/n(1)确定硬盘失效时间的概率分布函数为F(t);/n(2)硬盘故障时,存储系统的数据丢失代价正比于故障开始到当前的时间,比例系数为Lc,表示单位时间内的数据丢失代价;/n(3)确定硬盘的平均无故障时间MTBF值,为一个常数;/n(4)硬盘扫描检测时,单位时间内的扫描检测次数为n(t),一次扫描检测的代价为Sc,时刻t时总的扫描检测次数为

【技术特征摘要】
1.一种硬盘阵列扫描频率计算方法,其特征在于,过程如下:
(1)确定硬盘失效时间的概率分布函数为F(t);
(2)硬盘故障时,存储系统的数据丢失代价正比于故障开始到当前的时间,比例系数为Lc,表示单位时间内的数据丢失代价;
(3)确定硬盘的平均无故障时间MTBF值,为一个常数;
(4)硬盘扫描检测时,单位时间内的扫描检测次数为n(t),一次扫描检测的代价为Sc,时刻t时总的扫描检测次数为时刻t付出代价的数学期望值表示为如下公式:



为使得E(t)达到最小,即总的期望代价达到最小的检查次数函数,需满足:



对于N个硬盘的RAID阵列,可至少接收一个盘出错,得到RAID位错率为:
Pf=(N-1)·SBER·Cdisk
其中,N为RAID阵列组中硬盘的个数,Cdisk为单盘的容量,SBER为硬盘的潜在扇区失效率;
容单盘错的RAID系统的平均数据丢失时间MTTDL为MTBF的函数:
MTTDLRAID=MTBF/(N·Pf)
由可靠性理论,得到单个RAID阵列组的失效率为:



r(t)D为单个硬盘的失效率;
若整个系统共有M个硬盘组成阵列,那么整个存储系统的失效率为:



容单盘错存储系统的扫描检测次数满足如下公式:



基于上述过程,可基于系统代价的最小化目标得到硬...

【专利技术属性】
技术研发人员:周津刘超付彦淇何全仇旭东
申请(专利权)人:天津津航计算技术研究所
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1