一种磁盘故障检测方法以及装置制造方法及图纸

技术编号：30705002 阅读：16 留言：0更新日期：2021-11-06 09:48

本说明书提供一种磁盘故障检测方法以及装置，涉及通信技术领域。一种磁盘故障检测方法，应用于服务器，包括：向第一磁盘下发写入请求，监测阵列卡对第一磁盘的数据写入；若监测到针对第一磁盘的数据写入超出第一预设时长，则通过服务器中的BMC控制第一磁盘下电，其中，第一预设时长小于阵列卡中所设置的修复启动时长。通过上述方法，能够提升服务器的可靠性。能够提升服务器的可靠性。能够提升服务器的可靠性。

全部详细技术资料下载

【技术实现步骤摘要】
一种磁盘故障检测方法以及装置

[0001]本说明书涉及通信
，尤其涉及一种磁盘故障检测方法以及装置。

技术介绍

[0002]随着互联网应用的普及，作为承载服务的服务器的应用也随之增加，并且服务器还可以设置大量的磁盘作为存储设备保存海量的数据。随着磁盘数量的增加，则可以通过阵列卡对多个磁盘进行管理，此时，阵列卡可以接替磁盘先于缓存数据，并向服务器中所运行的程序进行反馈，之后再将所缓存的数据写入到实际的磁盘中进行存储。
[0003]在向磁盘写入数据出现故障时，为了避免后续数据写入的所造成的丢失，服务器中运行的程序可以对写入磁盘的数据进行阻塞，并等待对该故障磁盘的修复。在进行阻塞时，在接收到阻塞消息时，连接故障磁盘的阵列卡将会受到该阻塞消息的影响，停止向自身所连接的磁盘的数据写入，然而，一个阵列卡可能连接多个磁盘，这将导致所连接的磁盘都被置于被阻塞的状态，降低了服务器进行业务处理的能力，从而降低了服务器的可靠性。

技术实现思路

[0004]为克服相关技术中存在的问题，本说明书提供了一种磁盘故障检测方法以及装置。
[0005]结合本说明书实施方式的第一方面，本申请提供了一种磁盘故障检测方法，应用于服务器，包括：
[0006]向第一磁盘下发写入请求，监测阵列卡对第一磁盘的数据写入；
[0007]若监测到针对第一磁盘的数据写入超出第一预设时长，则通过服务器中的BMC控制第一磁盘下电，其中，第一预设时长小于阵列卡中所设置的修复启动时长。
[0008]可选的，在对阵列卡对...

【技术保护点】

【技术特征摘要】
1.一种磁盘故障检测方法，其特征在于，应用于服务器，包括：向第一磁盘下发写入请求，监测阵列卡对所述第一磁盘的数据写入；若监测到针对所述第一磁盘的数据写入超出第一预设时长，则通过所述服务器中的基板管理控制器BMC控制所述第一磁盘下电，其中，所述第一预设时长小于所述阵列卡中所设置的修复启动时长。2.根据权利要求1所述的方法，其特征在于，在对阵列卡对所述第一磁盘的数据写入进行监测之后，还包括：若监测到针对所述第一磁盘的数据写入超出第二预设时长，则重启与所述第一磁盘相对应的对象存储设备OSD，其中，所述第二预设时长小于所述第一预设时长。3.根据权利要求2所述的方法，其特征在于，在若监测到针对所述第一磁盘的数据写入超出第二预设时长之后，还包括：从所述服务器中创建的多个OSD中选择第二磁盘所对应的OSD；将所述第一磁盘所对应的OSD所承载的业务迁移至所述第二磁盘所对应的OSD。4.根据权利要求1所述的方法，其特征在于，在通过所述服务器中的BMC控制所述第一磁盘下电之后，还包括：对所述第一磁盘的下电次数进行累加；若所述第一磁盘的下电次数超出阈值，清除与所述第一磁盘相关联的OSD。5.根据权利要求4所述的方法，其特征在于，通过所述服务器中的BMC控制所述第一磁盘下电之后，还包括：通过所述服务器中的BMC控制所述第一磁盘上电；对所述第一磁盘进行启动检测；若在第三预设时长内确定所述第一磁盘未通过启动检测，则清除与所述第一磁...

【专利技术属性】
技术研发人员：彭俊钦，
申请(专利权)人：新华三技术有限公司成都分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人