磁盘的故障预测方法和装置制造方法及图纸

技术编号:15956041 阅读:31 留言:0更新日期:2017-08-08 09:55
本发明专利技术公开了一种磁盘的故障预测方法和装置。其中,该方法包括:通过磁盘监控技术获取磁盘的样本磁盘数据,其中,样本磁盘数据包括多个维度上的样本数据;采用Bucketing技术对样本磁盘数据进行分箱处理,对样本磁盘数据进行分类;采用Owlqn模型对分类后的样本磁盘数据进行样本训练,得到磁盘预测模型;在接收到待测磁盘的磁盘数据之后,使用磁盘预测模型对待测磁盘的磁盘数据进行处理,确定待测磁盘是否为故障磁盘。本发明专利技术解决了现有技术的硬盘故障预测系统中一些容易致使硬盘故障的因素不能被采集或量化导致的预测结果不准确的技术问题。

【技术实现步骤摘要】
磁盘的故障预测方法和装置
本专利技术涉及磁盘领域,具体而言,涉及一种磁盘的故障预测方法和装置。
技术介绍
目前,硬盘是存储数据的主要介质,硬盘一旦出故障,便会造成巨大的数据损失。因此如何保证硬盘的稳定性能非常重要。在通常状态下,硬盘在24小时中出错的概率在是万分之一左右,当一台服务器具有十块硬盘时,服务器硬盘出错的概率就会上升到千分之一,而随着当前网站等业务的发展,服务器需要使用的硬盘会越来越多,多块硬盘同时出错的概率也会提升。通常情况下,数据存储通常会有多个备份,如mysql主备库,GFS文件默认3个备份。在大量数据存储平台上,如果多个硬盘同时出故障,那么这些硬盘上存储着同一个文件的备份的概率就会很高,即如果多块硬盘同时出现故障,就会导致一些文件的丢失,对于一些线上的服务,大都依赖于服务器中存储的海量数据,如果硬盘出故障,就会导致上述在线服务异常,甚至暂停使用。由于上述原因,需要具有预测硬盘是否会出错的系统需要有一套系统能提前告诉我们哪些硬盘会出错,数据可能丢失导致硬盘故障的原因有很多,最常见的有以下几种:外部振动、温度和湿度、电器元件损坏、声音和灰尘,在上述因素中,有些因素能够被采集到,比如温度和湿度、一些元器件数据,但是更多的数据无法被采集和量化,因此便会导致预测结果不准确。针对现有技术的硬盘故障预测系统中一些容易致使硬盘故障的因素不能被采集胡或量化导致的预测结果不准确的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种磁盘的故障预测方法和装置,以至少解决现有技术的硬盘故障预测系统中一些容易致使硬盘故障的因素不能被采集或量化导致的预测结果不准确的技术问题。根据本专利技术实施例的一个方面,提供了一种磁盘的故障预测方法,包括:通过磁盘监控技术获取磁盘的样本磁盘数据,其中,样本磁盘数据包括多个维度上的样本数据;采用Bucketing技术对样本磁盘数据进行分箱处理,对样本磁盘数据进行分类;采用Owlqn模型对分类后的样本磁盘数据进行样本训练,得到磁盘预测模型;在接收到待测磁盘的磁盘数据之后,使用磁盘预测模型对待测磁盘的磁盘数据进行处理,确定待测磁盘是否为故障磁盘。根据本专利技术实施例的另一方面,还提供了一种磁盘的故障预测装置,包括:获取模块,用于通过磁盘监控技术获取磁盘的样本磁盘数据,其中,样本磁盘数据包括多个维度上的样本数据;分类模块,用于采用Bucketing技术对样本磁盘数据进行分箱处理,对样本磁盘数据进行分类;训练模块,用于采用Owlqn模型对分类后的样本磁盘数据进行样本训练,得到磁盘预测模型;确定模块,用于在接收到待测磁盘的磁盘数据之后,使用磁盘预测模型对待测磁盘的磁盘数据进行处理,确定待测磁盘是否为故障磁盘。在本专利技术实施例中,采用通过磁盘监控技术获取磁盘的样本磁盘数据,其中,样本磁盘数据包括多个维度上的样本数据;采用Bucketing技术对样本磁盘数据进行分箱处理,对样本磁盘数据进行分类;采用Owlqn模型对分类后的样本磁盘数据进行样本训练,得到磁盘预测模型的方式,通过在接收到待测磁盘的磁盘数据之后,使用磁盘预测模型对待测磁盘的磁盘数据进行处理,达到了确定待测磁盘是否为故障磁盘的目的,从而实现了预测磁盘故障的技术效果,进而解决了现有技术的硬盘故障预测系统中一些容易致使硬盘故障的因素不能被采集或量化导致的预测结果不准确的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种磁盘的故障预测方法的计算机终端的硬件结构框图;图2是根据本专利技术实施例一的磁盘的故障预测方法的流程图;图3是根据本专利技术实施例的一种可选的磁盘的故障预测方法的流程图;图4是根据本专利技术实施例的一种磁盘的故障预测装置的结构示意图;图5是根据本专利技术实施例的一种可选的磁盘的故障预测装置的结构示意图;图6是根据本专利技术实施例的一种可选的磁盘的故障预测装置的结构示意图;图7是根据本专利技术实施例的一种可选的磁盘的故障预测装置的结构示意图;图8是根据本专利技术实施例的一种可选的磁盘的故障预测装置的结构示意图;以及图9是根据本专利技术实施例的一种计算机终端的结构框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本专利技术实施例,提供了一种磁盘的故障预测方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是根据本专利技术实施例的一种磁盘的故障预测方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。存储器104可用于存储应用软件的软件程序以及模块,如本专利技术实施例中的磁盘的故障预测方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的磁盘的故障预测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(NetworkInterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互本文档来自技高网
...

【技术保护点】
一种磁盘的故障预测方法,其特征在于,包括:通过磁盘监控技术获取磁盘的样本磁盘数据,其中,所述样本磁盘数据包括多个维度上的样本数据;采用Bucketing技术对所述样本磁盘数据进行分箱处理,对所述样本磁盘数据进行分类;采用Owlqn模型对所述分类后的样本磁盘数据进行样本训练,得到磁盘预测模型;在接收到待测磁盘的磁盘数据之后,使用所述磁盘预测模型对所述待测磁盘的磁盘数据进行处理,确定所述待测磁盘是否为故障磁盘。

【技术特征摘要】
1.一种磁盘的故障预测方法,其特征在于,包括:通过磁盘监控技术获取磁盘的样本磁盘数据,其中,所述样本磁盘数据包括多个维度上的样本数据;采用Bucketing技术对所述样本磁盘数据进行分箱处理,对所述样本磁盘数据进行分类;采用Owlqn模型对所述分类后的样本磁盘数据进行样本训练,得到磁盘预测模型;在接收到待测磁盘的磁盘数据之后,使用所述磁盘预测模型对所述待测磁盘的磁盘数据进行处理,确定所述待测磁盘是否为故障磁盘。2.根据权利要求1所述的方法,其特征在于,所述样本磁盘数据为SMART磁盘数据,其中,所述样本磁盘数据至少包括如下四个维度上的样本数据:原始值、标准值、最差值和累积值。3.根据权利要求2所述的方法,其特征在于,在通过磁盘监控技术获取磁盘的样本磁盘数据之后,所述方法还包括:对每个维度上的样本数据进行如下任意一种或多种运算:差分运算、平方运算和分布求和运算,使得任意一个维度上的样本数据被扩展出新的维度上的样本数据。4.根据权利要求1至3中任意一项所述的方法,其特征在于,采用Bucketing技术对所述样本磁盘数据进行分箱处理,对所述样本磁盘数据进行分类,包括:确定预先划分的每个分箱的取值范围以及每个分箱对应的ID值;通过将每个维度上的样本数据离散化至对应的分箱来对所述样本磁盘数据进行分类,得到所述每个维度上的样本数据所对应的ID值。5.根据权利要求4所述的方法,其特征在于,采用Owlqn模型对所述分类后的样本磁盘数据进行样本训练,得到磁盘预测模型,包括:所述Owlqn模型对所述每个维度上的样本数据所对应的ID值进行训练,得到每个维度上的样本数据的权重值;根据所述每个维度上的样本数据及对应的权重值,确定所述磁盘预测模型,其中,所述磁盘预测模型包括所述每个维度上的样本数据的预测结果。6.根据权利要求5所述的方法,其特征在于,所述每个维度上的样本数据的预测结果为所述样本磁盘数据进行分类后得到的预测值。7.根据权利要求6所述的方法,其特征在于,在接收到待测磁盘的磁盘数据之后,使用所述磁盘预测模型对所述待测磁盘的磁盘数据进行处理,确定所述待测磁盘是否为故障磁盘,包括:接收到所述待测磁盘的磁盘数据之后,将所述待测磁盘的磁盘数据离散化至对应的分箱,得到所述待测磁盘的磁盘数据所对应的ID值;根据所述待测磁盘的磁盘数据所对应的ID值确定所述待测磁盘的磁盘数据的权重值;根据所述待测磁盘的磁盘数据的权重值从所述磁盘预测...

【专利技术属性】
技术研发人员:丁永明周俊崔卿瞿神全
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1