硬盘的故障检测方法、装置、设备及可读存储介质制造方法及图纸

技术编号:29160002 阅读:17 留言:0更新日期:2021-07-06 23:00
本申请实施例提供了一种硬盘的故障检测方法、装置、设备及可读存储介质,获取服务器集群中各个服务器节点的运行日志,依据运行日志,确定各个服务器节点的预设指标项的出现次数,若服务器节点的至少一项预设指标项的出现次数不小于预设指标项对应的预设次数阈值,将服务器节点的硬盘作为目标硬盘。其中,每一预设指标项对应的预设次数阈值依据服务器节点的硬盘出现故障的概率配置,进一步,本方法仅需获取目标硬盘进行SMART日志,并依据目标硬盘的SMART日志,检测目标硬盘是否出现故障。本方法无需获取每一服务器节点的硬盘的SMART日志,避免由于获取SMART日志的耗时较长,导致的故障处理不及时,也即,本方法通提高了硬盘故障检测的效率。

【技术实现步骤摘要】
硬盘的故障检测方法、装置、设备及可读存储介质
本申请涉及计算机
,尤其涉及一种硬盘的故障检测方法、装置、设备及可读存储介质。
技术介绍
随着计算机技术的飞速发展,为了满足不断提高的计算、存储海量数据的需求,现有技术一方面不断增大硬盘单盘容量,另一方面利用服务器集群技术,不断增加服务器集群挂载的硬盘数量,在服务器集群的实际运维工作中,通常抓取每一硬盘的S.M.A.R.T(Self-MonitoringAnalysisandReportingTechnology”,硬盘的自我监测和分析及报告技术)日志(简称为SMART日志)中的指标项进行故障判断和处理,但对于规模日益壮大的服务器集群来说,业务系统对硬盘的访问量呈现几何级的增长,且硬盘多数时间处于100%繁忙的工作状态,因此硬盘故障率大大增加,显然采集每一块故障硬盘的SMART日志进行故障处理的方法,由于SMART日志的获取过程耗时长,往往导致故障处理不及时,硬盘故障检测的效率有待提高。
技术实现思路
本申请提供了一种硬盘的故障检测方法、装置、设备及可读存储介质,目的在于提高获取硬盘的故障信息的效率,如下:一种硬盘的故障检测方法,包括:获取服务器集群中各个服务器节点的运行日志;依据每一所述服务器节点的运行日志,确定每一所述服务器节点的预设指标项的出现次数;若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘;所述预设指标项对应的预设次数阈值依据所述服务器节点的硬盘出现故障的概率配置,在所述服务器节点的历史运行日志中,所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值时,所述服务器节点的硬盘出现故障的概率大于第一预设概率阈值;获取所述目标硬盘的SMART日志;依据所述目标硬盘的SMART日志,检测所述目标硬盘是否出现故障。可选地,预设指标项包括:强相关指标项和次相关指标项,所述强相关指标项对应的预设次数阈值等于1,所述次相关指标项对应的预设次数阈值大于1。可选地,若服务器节点的至少一项所述预设指标项的出现次数大于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘,包括:若在所述运行日志中存在至少一项所述强相关指标项,将所述服务器节点的硬盘作为目标硬盘;若在所述运行日志中不存在所述强相关指标项,判断各个所述次相关指标项的出现次数是否大于所述次相关指标项对应的预设次数阈值;若至少一项所述次相关指标项的出现次数大于所述次相关指标项对应的预设次数阈值,确定所述服务器节点的硬盘为目标硬盘。可选地,依据目标硬盘的SMART日志,检测所述目标硬盘是否出现故障,包括:依据所述目标硬盘的SMART日志,确定预设硬盘指标项的数值;若至少一项所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件,确定所述目标硬盘出现故障,每一所述预设指标项的数值对应的预设故障条件依据所述目标硬盘出现故障的概率配置,在所述目标硬盘的历史SMART日志中,所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件时,所述目标硬盘出现故障的概率大于第二预设概率阈值。可选地,预设硬盘指标项包括第一预设硬盘指标项、第二预设硬盘指标项、第三预设硬盘指标项和第四预设硬盘指标项;所述第一预设硬盘指标项对应的预设故障条件为:所述第一预设硬盘指标项的数值非0;所述第二预设硬盘指标项对应的预设故障条件为:所述第二预设硬盘指标项的数值等于预设故障值;所述第三预设硬盘指标项对应的预设故障条件为:所述第三预设硬盘指标项的数值不等于预设正常值;所述第四预设硬盘指标项对应的预设故障条件为:所述第四预设硬盘指标项的数值超过预设数值阈值。可选地,若至少一项所述预设硬盘指标项的数值满足所述预设指标项对应的预设故障条件,确定所述目标硬盘出现故障,包括:若满足:至少一项所述第一预设硬盘指标项的数值非0、至少一项所述第二预设硬盘指标项的数值等于第一预设数值、至少一项所述第三预设硬盘指标项的数值不等于第二预设数值、和至少一项所述第四预设硬盘指标项的数值超过预设数值阈值中至少一项,则确定所述目标硬盘出现故障。一种硬盘的故障检测装置,包括:第一日志获取单元,用于获取服务器集群中各个服务器节点的运行日志;次数获取单元,用于依据每一所述服务器节点的运行日志,确定每一所述服务器节点的预设指标项的出现次数;目标硬盘确定单元,用于若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘;所述预设指标项对应的预设次数阈值依据所述服务器节点的硬盘出现故障的概率配置,在所述服务器节点的历史运行日志中,所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值时,所述服务器节点的硬盘出现故障的概率大于第一预设概率阈值;第二日志获取单元,用于获取所述目标硬盘的SMART日志;故障确定单元,用于依据所述目标硬盘的SMART日志,检测所述目标硬盘是否出现故障。可选地,故障确定单元用于依据所述目标硬盘的SMART日志,检测所述目标硬盘是否出现故障,包括:所述故障确定单元具体用于:依据所述目标硬盘的SMART日志,确定预设硬盘指标项的数值;若至少一项所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件,确定所述目标硬盘出现故障,每一所述预设指标项的数值对应的预设故障条件依据所述目标硬盘出现故障的概率配置,在所述目标硬盘的历史SMART日志中,所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件时,所述目标硬盘出现故障的概率大于第二预设概率阈值。一种硬盘的故障检测设备,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,实现硬盘的故障检测方法的各个步骤。一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现硬盘的故障检测方法的各个步骤。由上述技术方案可以看出,本申请实施例提供的硬盘的故障检测方法、装置、设备及可读存储介质,获取服务器集群中各个服务器节点的运行日志,依据运行日志,确定各个服务器节点的预设指标项的出现次数,若服务器节点的至少一项预设指标项的出现次数不小于预设指标项对应的预设次数阈值,将服务器节点的硬盘作为目标硬盘。由于,在服务器节点的历史运行日志中,预设指标项的出现次数不小于预设指标项对应的预设次数阈值时,服务器节点的硬盘出现故障的概率大于第一预设概率阈值,所以,目标硬盘为出现故障的概率大于第一预设概率阈值的硬盘。因此,本方法仅需获取目标硬盘进行SMART日志,并依据目标硬盘的SMART日志,检测目标硬盘是否出现故障。由于,获取服务器节点的运行日志的耗时短且效率高,因此,本方法无需获取每一服务器节点的硬盘的SMART日志,避免由于获取SMART日志的耗时本文档来自技高网...

【技术保护点】
1.一种硬盘的故障检测方法,其特征在于,包括:/n获取服务器集群中各个服务器节点的运行日志;/n依据每一所述服务器节点的运行日志,确定每一所述服务器节点的预设指标项的出现次数;/n若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘;所述预设指标项对应的预设次数阈值依据所述服务器节点的硬盘出现故障的概率配置,在所述服务器节点的历史运行日志中,所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值时,所述服务器节点的硬盘出现故障的概率大于第一预设概率阈值;/n获取所述目标硬盘的SMART日志;/n依据所述目标硬盘的SMART日志,检测所述目标硬盘是否出现故障。/n

【技术特征摘要】
1.一种硬盘的故障检测方法,其特征在于,包括:
获取服务器集群中各个服务器节点的运行日志;
依据每一所述服务器节点的运行日志,确定每一所述服务器节点的预设指标项的出现次数;
若所述服务器节点的至少一项所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘;所述预设指标项对应的预设次数阈值依据所述服务器节点的硬盘出现故障的概率配置,在所述服务器节点的历史运行日志中,所述预设指标项的出现次数不小于所述预设指标项对应的预设次数阈值时,所述服务器节点的硬盘出现故障的概率大于第一预设概率阈值;
获取所述目标硬盘的SMART日志;
依据所述目标硬盘的SMART日志,检测所述目标硬盘是否出现故障。


2.根据权利要求1所述的方法,其特征在于,所述预设指标项包括:强相关指标项和次相关指标项,所述强相关指标项对应的预设次数阈值等于1,所述次相关指标项对应的预设次数阈值大于1。


3.根据权利要求2所述的方法,其特征在于,所述若服务器节点的至少一项所述预设指标项的出现次数大于所述预设指标项对应的预设次数阈值,将所述服务器节点的硬盘作为目标硬盘,包括:
若在所述运行日志中存在至少一项所述强相关指标项,将所述服务器节点的硬盘作为目标硬盘;
若在所述运行日志中不存在所述强相关指标项,判断各个所述次相关指标项的出现次数是否大于所述次相关指标项对应的预设次数阈值;
若至少一项所述次相关指标项的出现次数大于所述次相关指标项对应的预设次数阈值,确定所述服务器节点的硬盘为目标硬盘。


4.根据权利要求1或3所述的方法,其特征在于,所述依据目标硬盘的SMART日志,检测所述目标硬盘是否出现故障,包括:
依据所述目标硬盘的SMART日志,确定预设硬盘指标项的数值;
若至少一项所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件,确定所述目标硬盘出现故障,每一所述预设指标项的数值对应的预设故障条件依据所述目标硬盘出现故障的概率配置,在所述目标硬盘的历史SMART日志中,所述预设硬盘指标项的数值满足所述预设硬盘指标项对应的预设故障条件时,所述目标硬盘出现故障的概率大于第二预设概率阈值。


5.根据权利要求4所述的方法,其特征在于,所述预设硬盘指标项包括第一预设硬盘指标项、第二预设硬盘指标项、第三预设硬盘指标项、和第四预设硬盘指标项;
所述第一预设硬盘指标项对应的预设故障条件为:所述第一预设硬盘指标项的数值非0;
所述第二预设硬盘指标项对应的预设故障条件为:所述第二预设硬盘指标项的数值等于预设故障值;
所述第三预设硬盘指标项对应的预设故障条件为:所述...

【专利技术属性】
技术研发人员:彭洁刘谦刘畅屈大伟李宇翔陈龙辉
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1