【技术实现步骤摘要】
服务器集群硬盘故障处理方法、装置、电子设备及存储介质
本专利技术涉及硬盘系统故障检测处理技术,尤其涉及服务器集群硬盘故障处理方法、装置、电子设备及存储介质。
技术介绍
随着计算机技术的不断发展,服务器集群可以提供安全可靠的弹性计算服务,还可以提供不同的实例类型来满足用户特定的使用场景。这些服务器集群的实例类型由CPU、内存、存储和网络组成不同的组合,但是当服务器集群的硬盘发生掉线、只读等问题后,用户部署在该服务器上的子机业务也会受到影响。相关技术将将发生异常的硬盘替换的方式来进行故障恢复,不但增加了故障处理的等待时间,也会造成数据丢失的风险,影响用户使用。
技术实现思路
有鉴于此,本专利技术实施例提供一种服务器集群硬盘故障处理方法、装置、电子设备及存储介质,能够自动化的对服务器集群硬盘的故障类型进行检测,对服务器集群硬盘故障进行修复,减少服务器集群硬盘的更换率,降低服务器集群系统的运行成本并提升对服务器集群硬盘维护的效率,保证服务器集群用户的数据安全,提高用户的使用体验。本专利技术实施例的技术方案
【技术保护点】
1.一种服务器集群硬盘故障处理方法,其特征在于,所述方法包括:/n获取服务器集群硬盘的故障警示信息;/n响应于所述服务器集群硬盘的故障警示信息,调用所述服务器集群硬盘的运行数据;/n基于所述服务器集群硬盘的运行数据,确定所述服务器集群硬盘故障的类型;/n当所述服务器集群硬盘故障的类型为不可用告警时,触发相匹配的无硬件故障检测进程,获取所述无硬件故障检测进程的检测结果;/n基于所述无硬件故障检测进程的检测结果,对所述服务器集群硬盘故障进行修复。/n
【技术特征摘要】
1.一种服务器集群硬盘故障处理方法,其特征在于,所述方法包括:
获取服务器集群硬盘的故障警示信息;
响应于所述服务器集群硬盘的故障警示信息,调用所述服务器集群硬盘的运行数据;
基于所述服务器集群硬盘的运行数据,确定所述服务器集群硬盘故障的类型;
当所述服务器集群硬盘故障的类型为不可用告警时,触发相匹配的无硬件故障检测进程,获取所述无硬件故障检测进程的检测结果;
基于所述无硬件故障检测进程的检测结果,对所述服务器集群硬盘故障进行修复。
2.根据权利要求1所述的方法,其特征在于,所述获取服务器集群硬盘的故障警示信息,包括:
监听所述服务器集群硬盘的运行参数,当所述服务器集群硬盘的运行参数达到警示阈值时,触发所述服务器集群硬盘的故障警示信息;或者
接收服务器集群用户报警信息,并基于所述服务器集群用户的参数,确定与所述服务器集群用户相匹配的服务器集群硬盘,触发所述服务器集群硬盘的故障警示信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述服务器集群硬盘的运行数据,确定所述服务器集群硬盘故障的类型,包括:
确定所述服务器集群硬盘的硬盘属性参数,其中,所述硬盘属性参数包括:硬盘型号、服务器型号、上架时间、版本号以及硬盘的分区标识;
基于所述服务器集群硬盘的硬盘属性参数,调取相应存储介质中所保存的所述服务器集群硬盘的运行数据;
根据所述服务器集群硬盘的硬盘属性参数,获取对应的故障类型特征;
通过对所述服务器集群硬盘的运行数据与所述故障类型特征的交叉比对,确定所述服务器集群硬盘故障的类型,其中,所述服务器集群的故障类型包括:不可用告警和失效告警。
4.根据权利要求1所述的方法,其特征在于,所述当所述服务器集群硬盘故障的类型为不可用告警时,触发相匹配的无硬件故障检测进程,获取所述无硬件故障检测进程的检测结果;
当所述服务器集群硬盘故障的类型为不可用告警时,通过触发相匹配的无硬件故障检测进程,获取与所述服务器集群硬盘相匹配的检测参数;
对所述服务器集群硬盘相匹配的检测参数进行多维度处理,确定所述服务器集群硬盘在不同维度中的检测结果;
对所述服务器集群硬盘在不同维度中的检测结果进行融合处理,确定所述无硬件故障检测进程的检测结果。
5.根据权利要求4所述的方法,其特征在于,所述对所述服务器集群硬盘相匹配的检测参数进行多维度处理,确定所述服务器集群硬盘在不同维度中的检测结果,包括:
基于所述服务器集群硬盘对应的硬盘保护参数,确定相应的参数健康检测结果;
通过对所述硬盘保护参数的标准化处理,确定所述硬盘保护参数的分布特征检测结果;
通过对所述硬盘保护参数的动态斜率处理,确定所述硬盘保护参数的恶化趋势结果;
通过对所述硬盘保护参数的预测函数处理,确定所述硬盘保护参数对应的故障概率结果;
对所述参数健康检测结果、分布特征检测结果、恶化趋势结果以及故障概率结果进行融合处理,确定所述服务器集群硬盘在不同维度中的检测结果。
6.根据权利要求1所述的方法,其特征在于,所述基于所述无硬件故障检测进程的检测结果,对所述服务器集群硬盘故障进行修复,包括:
基于所述无硬件故障检测进程的检测结果,确定所述服务器集群硬盘相匹配的故障修复方式;
基于与所述服务器集群硬盘相匹配的故障修复方式,触发对应的故障修复进程,并通过所述故障修复进程对所述服务器集群硬盘故障进行修复。
7.根据权利要求6所述的方法,其特征在于,所述基于与所述服务器集群硬盘相匹配的故障修复方式,触发对应的故障修复进程,并通过所述故障修复进程对所述服务器集群硬盘故障进行修复,包括:
当确定所述服务器集群硬盘支持电压复位功能时,确定与所述服务器集群硬盘相匹配的故障修复方式为电压复位进程;
通过所述电压复位进程,触发携带电压复位指令的引导代码,并通...
【专利技术属性】
技术研发人员:牛犇,刘抗抗,陈海超,林哲伟,赵亮,严勇,刘裕勋,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。