分析启动的预测性故障和SMART日志制造技术

技术编号:27482564 阅读:21 留言:0更新日期:2021-03-02 17:54
分析启动的预测性故障和SMART日志。一个方面包括从多个盘设备接收包括数据的驱动器日志页面,其中驱动器日志页面包括多个属性字段,多个属性字段包括重新分配字段,重新分配字段跟踪从盘设备的故障扇区到盘设备的新扇区的数据移动。由系统根据驱动器日志页面的属性数据执行故障预测,以识别多个盘设备中的被预测为发生故障的一个或多个盘设备。由系统响应于故障预测而禁用一个或多个磁盘设备。应于故障预测而禁用一个或多个磁盘设备。应于故障预测而禁用一个或多个磁盘设备。

【技术实现步骤摘要】
分析启动的预测性故障和SMART日志


[0001]本专利技术总体上涉及预测盘设备故障,并且更具体地,涉及基于分析启动的预测性故障(AIPFA)分析和驱动器日志页面的属性(诸如例如,自我监测、分析和报告技术(SMART)日志的属性)来预测盘设备故障。

技术介绍

[0002]短语“机器学习”广义地描述了从数据中学习的电子系统的功能。机器学习系统、引擎或模块可以包括可训练的机器学习算法,该机器学习算法可以例如在外部云环境中被训练以学习输入和输出之间的功能关系,其中所述功能关系当前是未知的。
[0003]SMART广义上是指盘驱动器和驱动器控制器之间的接口的功能,其中驱动器控制器通过SMART接口以属性的形式从盘驱动器接收信息。

技术实现思路

[0004]本专利技术的实施例提供了一种用于基于AIPFA分析和驱动器日志页面的属性(诸如例如SMART日志的属性)进行盘设备故障预测的计算机实现的方法。一种非限制性示例的计算机实现的方法包括:由包括一个或多个处理器的系统接收驱动器日志页面,所述驱动器日志页面包括来自多个盘设备的数据,其中所述驱动器日志页面包括多个属性字段,所述多个属性字段包括重新分配字段,所述重新分配字段跟踪从盘设备的故障扇区到盘设备的新扇区的数据移动。所述方法包括由系统基于驱动器日志页面的属性数据执行故障预测,以识别所述多个盘设备中的被预测为发生故障的一个或多个盘设备。所述方法包括由系统响应于所述故障预测而禁用所述一个或多个盘设备。
[0005]本专利技术的其他实施例以计算机系统和计算机程序产品来实现上述方法的特征。
[0006]通过本专利技术的技术实现了附加的技术特征和益处。本专利技术的各实施例和各方面在本文中被详细描述,并且被视为所要求保护的主题的一部分。为了更好的理解,请参考详细描述和附图。
附图说明
[0007]在说明书的结尾处的权利要求书中特别地指出并且明确地要求保护本文中所述的专有权的细节。从以下结合附图进行的详细描述中,本专利技术的实施例的前述以及其他特征和优点将变得明显,在附图中:
[0008]图1描绘根据本专利技术的一个或多个实施例的示例分布式环境的框图;
[0009]图2A-图2C组合描绘根据本专利技术的一个或多个实施例的示例SMART日志。
[0010]图3描绘根据本专利技术的一个或多个实施例的示例分析环境的系统架构;
[0011]图4描绘示出根据本专利技术的一个或多个实施例的方法的流程图;
[0012]图5描绘根据本专利技术的一个或多个实施例的云计算环境;
[0013]图6描绘根据本专利技术的一个或多个实施例的抽象模型层;以及
[0014]图7描绘能够实现本专利技术的一个或多个实施例的示例性计算机系统。
[0015]本文中所描绘的图是说明性的。在不偏离本专利技术的精神的情况下,本文中描述的图或操作可以有许多变型。例如,可以以不同的顺序执行动作,或者可以添加、删除或修改动作。另外,术语“耦合”及其变型描述了在两个元件之间具有通信路径,并且并不意味着元件之间的直接连接而在元件之间没有中间元件/连接。所有这些变型均被视为说明书的一部分。
具体实施方式
[0016]本专利技术的一个或多个实施例提供了一种驱动器分析系统,该驱动器分析系统以流线型(stream-lined)的方式收集为预测分析所需要的关键数据,其中基于为预测现场的当前故障所需要的新数据来选择关键字段以添加到改进的驱动器日志页面(诸如例如自我监测、分析和报告技术(SMART)日志页面)。已添加的新字段的示例是“包括待决的重新分配在内的重新分配”字段(即重新分配字段),该重新分配字段是除了其他方面之外还可以用来预测在过去两年导致客户数据丢失的前三个驱动器的故障的关键数据。该系统可以每周(心跳)从驱动器收集数据,并且将该数据传递到数据保持系统,以及分析系统可以从数据保持系统拉取数据以进行分析。然后,对所有驱动器上的所有数据进行趋势分析,以及如果部件发生故障,则导致故障的数据将被分析系统使用,以了解如何识别其他可能发生故障的驱动器。来自所有驱动器中的数据都用于分析,而不仅仅是发生故障的驱动器。分析系统可能会禁用它已预测可能发生故障的驱动器。在本专利技术的一些实施例中,禁用包括经由电子和/或物理移除来移除驱动器。关于“包括待决的重新分配在内的重新分配”字段,在盘的一小部分损坏的情况下,可能会发生“重新分配”。预留了备用扇区来处理该错误,并且将数据“重新分配”到备用扇区之一。当数据尚未被重新分配时,发生“待决的重新分配”。例如,在驱动器已识别出损坏区域但是驱动器尚未接收到要存储在新位置中的新数据的情况下,可能会发生“待决的重新分配”。换句话说,重新分配字段跟踪需要将数据从边际(marginal)扇区移动到盘设备的新扇区的频率。
[0017]当代分析系统使用预定义的参数集合来预测驱动器故障,这些参数是在系统或固件设计级别设置的。因此,基于在现场实时识别的问题来更新那些系统可能既耗时又效率低下。
[0018]类似地,当代系统采用属性的SMART日志捕获。然而,由于这些SMART日志中捕获的数据范围有限,因此这些现代系统提供了不准确的结果。这些系统当前没有使用基于相关部件的全局安装来进行用于系统的故障预测的SMART分析。而是,这些系统采用预测算法,该预测算法受到在产品发布或代码更新时当前已知的驱动器信息的限制。
[0019]当代系统具有几个缺点。首先,一些当代系统要求从驱动器设备中检索完整的系统日志,然后日志被完整地解析,与将要在下面更详细地描述的更新的SMART日志相比,这既耗时又不太紧凑。
[0020]本专利技术的一个或多个实施例通过提供如下分析系统来解决现有技术的上述缺点中的一个或多个缺点,在数据被传送到分析系统之前,该分析系统依赖于驱动器将数据压缩到驱动器日志页面(诸如例如SMART日志)中。然后,分析系统实时地利用数据来预测故障或驱动器,和/或无需人工参与即可提供给系统。所收集的数据可用于更快地隔离全局问
题,并且关于是否将驱动器用于特定应用做出实时决定。在本专利技术的一些实施例中,故障预测和反馈的改进的处理极大地减少了计划外的系统中断的数量和时长。在本专利技术的一些实施例中,分析系统被配置为响应于预测驱动器可能发生故障而在方便的时间禁用(例如,移除)驱动器,而不是在重要操作期间使多个驱动器同时发生故障,这可能导致数据丢失、系统停机或系统变慢。
[0021]现在转向图1,示出了用于执行盘驱动器故障预测的示例分布式环境100。分布式环境100包括经由网络106互连的一个或多个用户设备102和分析系统104。图1仅提供了一个示例系统的图示,并且没有暗示对可以实现本专利技术的不同实施例的其他系统的任何限制。在不偏离权利要求所记载的本专利技术的范围的情况下,本领域技术人员可以对所描绘的环境进行各种适当的修改。
[0022]分析系统104包括预测组件108、消息传递组件110、机器学习组件112和/或一个或多个数据库114。在本专利技术的一些实施例中,预测组件108、消息传递组件1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机实现的方法,包括:由包括一个或多个处理器的系统接收驱动器日志页面,所述驱动器日志页面包括来自多个盘设备的数据,其中所述驱动器日志页面包括多个属性字段,所述多个属性字段包括重新分配字段,所述重新分配字段跟踪从盘设备的故障扇区到盘设备的新扇区的数据移动;由所述系统基于所述驱动器日志页面的属性数据执行故障预测,以识别所述多个盘设备中的被预测为发生故障的一个或多个盘设备;以及由所述系统响应于所述故障预测而禁用所述一个或多个盘设备。2.根据权利要求1所述的计算机实现的方法,其中所述多个属性字段中的每个属性字段与以下各项中的一个或多个相关联:属性名称字段、存储器驱动器类型指示符字段和原始数据定义字段。3.根据权利要求2所述的计算机实现的方法,其中与所述重新分配字段相关联的所述原始数据定义字段包括指示以下内容的定义:选择字节值存储盘驱动器的头的标识符,和特定字节值范围存储对于字节值处的头的重新分配次数。4.根据权利要求3所述的计算机实现的方法,其中所述重新分配字段的定义还包括:字节11-14存储对于在字节6处的头的待决的重新分配次数。5.根据权利要求1所述的计算机实现的方法,还包括...

【专利技术属性】
技术研发人员:D
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1