一种基于linux下的硬盘随机热拔插稳定性检测方法技术

技术编号:12737346 阅读:59 留言:0更新日期:2016-01-20 21:39
本发明专利技术公开了一种基于linux下的硬盘随机热拔插稳定性检测方法,所述方法操作过程如下:搭建测试环境;配置系统参数;根据不同的应用场景,安装不同的操作系统;将系统完全安装;选择硬盘检测工具;进行硬盘随机热拔插测试:准备工作完成后,进行硬盘随机热拔插动作,并执行硬盘稳定性检测脚本。本发明专利技术方法适用于支持热拔插配置的服务器,模拟服务器在拔插过程中硬盘的稳定性,以满足客户在实际应用当中避免更换硬盘后,硬盘状态异常导致服务器工作状态受到影响。本方法操作简单,执行一条命令即可以看到硬盘的工作状态,在测试中可以快速的做出硬盘的稳定性检测。

【技术实现步骤摘要】

本专利技术涉及硬盘稳定性检测
,具体涉及。
技术介绍
随着IT领域技术的不断发展,传统信息化服务以及日趋强大的云计算服务对服务器的需求越来越复杂。作为服务器产品提供商,一款服务器的好坏,在于是否能够满足不同的应用需求。由于在硬盘出现故障的时候,传统的非热拔插的服务器需要对节点进行关机,再进行更换的动作,影响了服务器工作的效率;另外,在可热拔插的服务器上,也常出现更换硬盘后,硬盘速率降低,或者硬盘顺序漂移的情况,在此情况下,硬盘热拔插的稳定性在客户后期维护后是否能够依然稳定,成为了客户比较关心的问题;在客户实际应用环境中,每一次的更换硬盘都能保证的稳定的工作,才能保证整个服务器工作效率的稳定。所以对于硬盘随机热拔插的稳定性是十分重要的。硬盘随机热拔插是指可以对硬盘进行不断电的情况下进行拔插,在客户端如果发现硬盘出I/O error或者硬盘出现其它故障的时候,可以在系统正常工作的情况,将故障硬盘进行替换,在不影响服务器正常工作的情况下完成故障的修复,这种情况是在目前大数据时代应用中一种非常方便而且高效的应用方式。测试中对硬盘热拔插动作时,需要注意硬盘的供电状态。当拔插硬盘时,要待等硬盘背板的状态指未灯完全熄灭为止,理论上硬盘拔除后系统硬盘会立马做出响应,响应的特征为系统/var/log/messages中的记录硬盘移除的日志;同样,当硬盘插入时,硬盘状态指示灯应该正常亮起,此时/var/log/messages中应该记录硬盘插入后的日志。这是一个完整的硬盘热拔插的循环。Shell脚本是一个自动完成指令的一个命令集,可以通过良好的编程思想,将复杂的工作变的简单化,也可以将繁琐的工作内容交给计算机进行批量的准确的完成。
技术实现思路
本专利技术要解决的技术问题是:基于上述技术,如果能够通过shell脚本,自动完成硬盘拔插后的状态检测,将会加速硬盘稳定性的检测工作,能够在短时间内检测到硬盘稳定性是否正常,并针对存在的问题做出快速的响应。为解决这一问题,本专利技术提供,可以适用于不同硬盘。本专利技术所采用的技术方案为: ,所述方法操作过程如下: 一、搭建测试环境:根据实际应用需求,选择不同类型的硬盘进行测试,服务器需要支持硬盘热拔插;检测硬盘在位状态、容量、SN、速率、盘符; 二、配置系统参数:根据不同的应用场景,安装不同的操作系统;将系统完全安装;测试搭建完成,系统能够正常检测到节点的硬盘设备; 三、选择硬盘检测工具:对测试中的机器,拷贝不同厂商的硬盘检测工具;并执行硬盘测试工具是否可以正常执行; 四、进行硬盘随机热拔插测试:准备工作完成后,进行硬盘随机热拔插动作,并执行硬盘稳定性检测脚本,查看每一次硬盘拔插后系统硬盘的状态;通过结果判断测试硬盘的稳定性是否稳定,并有针对性进行修复。所述实现步骤在安装有linux内核的操作系统的服务器中完成,操作时用户以root身份登录进行。所述硬盘稳定性检测脚本采用SHELL脚本编写,实现在硬盘拔插后硬盘状态的检测。所述检测方法在每一次拔插后执行一下脚本得到检测结果,或进行多次拔插后,再执行脚本,得到最终拔插后节点上硬盘的工作状态是否正常。所述测试过程如下: 1)随机拔除一块非系统硬盘; 2)查看硬盘背板指未灯是否媳灭,并查看messageslog,确认系统已经响应到硬盘拔除动作; 3)此时执行硬盘稳定性检测脚本会在屏幕上显示硬盘SN,容量和速度匹配不对的提示; 4)将硬盘插回原来位置,并查看messageslog,确认系统已经响应到硬盘插回动作; 5)执行硬盘稳定性检测脚本,如果检测插回的硬盘的各种指标都是正常的,将不会有任何错误提示;如果插回后出现异常,将会提示; 6)测试结果会存放在名为random_hotplug.csv的文件中,当硬盘不在位或者硬盘插回后出现异常,则在random_hotplug.csv中会记一条error;正常的话会记一条ok; 7)通过上的结果就可以看到每一次拔插硬盘的状态情况是否正常。如果在测试中当硬盘插回后,执行脚本动作过快,可能会导致0S还没有响应到硬盘已经插回,此时脚本检测会误报的,因此在脚本检测执行过程中,要等0S响应后再进行检验,保证检验的有效性。如果测试中硬盘0S已经响应到硬盘插回的动作了,但是执行脚本仍然报硬盘有error,此时硬盘可能在拔插过程中出现了问题,对出问题的硬盘进行第2次拔插测试,确认硬盘是否可以恢复到正常状态,当硬盘无法恢复时,需要硬盘将问题反馈硬盘厂商,分析硬盘在拔插中硬盘无法正常工作的原因并改善。所述方法测试过程中每块硬盘测试cycle为30次,测试时随机测试,随机拔插不同slot位置的硬盘,当一个硬盘做完一次拔插测试后,再进行下一个硬盘的拔插测试。本专利技术的有益效果为: 本专利技术一种基于linux系统的硬盘稳定性检测方法,需要在可热拔插的服务器上,不同的硬盘厂商之间进行检测,可以支持多种操作系统:redhat、centos, suse上运行应用;该方法操作简便,具有较好的易用性;程序中各模块之间结构清晰,便于维护;并可以通过这个硬盘稳定性检测方法,发现不同厂商的硬盘在与expander和硬盘背板之间工作的稳定性存在问题,并针对硬盘存在的问题进行FW开发,避免在实际应用中出现更新硬盘之后硬盘不能正常工作的情况;本专利技术借用SHELL脚本编写,可以实现在硬盘拔插后硬盘状态的检测,可以在每一次拔插后执行一下脚本得到检测结果,也可以进行多次拔插后,再执行脚本,得到最终拔插后节点上硬盘的工作状态是否正常。本专利技术方法适用于支持热拔插配置的服务器,模拟服务器在拔插过程中硬盘的稳定性,以满足客户在实际应用当中避免更换硬盘后,硬盘状态异常导致服务器工作状态受到影响。另外,本方法操作简单,执行一条命令即可以看到硬盘的工作状态,在测试中可以快速的做出硬盘的稳定性检测。【附图说明】图1为本专利技术测试方法流程图。【具体实施方式】下面根据说明书附图,结合【具体实施方式】对本专利技术进一步说明: 实施例1: 如图1所示,,所述方法操作过程如下: 一、搭建测试环境:根据实际应用需求,选择不同类型的硬盘进行测试,服务器需要支持硬盘热拔插;检测硬盘在位状态、容量、SN、速率、盘符; 二、配置系统参数:根据不同的应用场景,安装不同的操作系统,支持RHEL、Centos,SUSE系列的OS ;将系统完全安装;测试搭建完成,系统可以正常检测到节点的硬盘设备; 三、选择硬盘检测工具:对测试中的机器,拷贝不同厂商的硬盘检测工具;并执行硬盘测试工具是否可以正常执行; 四、进行硬盘随机热拔插测试:准备工作完成后,进行硬盘随机热拔插动作,并执行硬盘稳定性检测脚本,查看每一次硬盘拔插后系统硬盘的状态;硬盘移除后,运行稳定性检测脚本,可以查看系统上硬盘少了一块;硬盘插回,运行稳定性检测脚本,可以检测硬盘插回后的硬盘容量,SN,速率,盘符是否变化;通过结果可以判断测试硬盘的稳定性是否稳定,并有针对性进行修复。实施例2: 在实施例1的基础上,本实施例所述实现步骤在安装有linux内核的操作系统的服务器中完成,操作时用户以root身份登录进行。实施例3: 在实施例1的基础上,本实施例所述硬盘稳定性检测脚本采用SHEL当前第1页1本文档来自技高网
...

【技术保护点】
一种基于linux下的硬盘随机热拔插稳定性检测方法,其特征在于,所述方法操作过程如下:一、搭建测试环境:根据实际应用需求,选择不同类型的硬盘进行测试,服务器需要支持硬盘热拔插;检测硬盘在位状态、容量、SN、速率、盘符;二、配置系统参数:根据不同的应用场景,安装不同的操作系统;将系统完全安装;测试搭建完成,系统能够正常检测到节点的硬盘设备;三、选择硬盘检测工具:对测试中的机器,拷贝不同厂商的硬盘检测工具;并执行硬盘测试工具是否可以正常执行; 四、进行硬盘随机热拔插测试:准备工作完成后,进行硬盘随机热拔插动作,并执行硬盘稳定性检测脚本,查看每一次硬盘拔插后系统硬盘的状态;通过结果判断测试硬盘的稳定性是否稳定,并有针对性进行修复。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘智刚
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1