一种RAID盘组故障自动下线报修方法及系统技术方案

技术编号:26923668 阅读:14 留言:0更新日期:2021-01-01 22:47
本发明专利技术实施例提供一种RAID盘组故障自动下线报修方法及系统,其中,所述方法包括:循环遍历服务器上的RAID盘组,获取服务器上每一个RAID盘组的读写性能、状态及寿命;根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定,并根据判定结果对RAID盘组进行剔除下线;将剔除下线的RAID盘组的日志信息写入本地故障日志;根据记录的本地故障日志向报修接口发送报修报警。根据本发明专利技术的技术方案,通过监测盘组的当前使用状态、盘组的寿命及盘组的读写性能来自动判断故障RAID盘组或者是疑似故障的RAID盘组,根据设定时间进行一次检测,故障发现及时准确。

【技术实现步骤摘要】
一种RAID盘组故障自动下线报修方法及系统
本专利技术涉及计算机领域,具体涉及一种RAID盘组故障自动下线报修方法及系统。
技术介绍
RAID盘组指的是磁盘阵列,简单来说就是由N块独立的磁盘,组合成一个容量巨大的逻辑磁盘组。这个偌大的磁盘组主要作用就是存储CDN服务所用的资源,支撑线上CDN服务能够正常的运作。RAID盘组故障是指磁盘硬件资源由于某种原因导致读写异常甚至不工作的情况。线上正在运行的服务器如果出现了故障盘组没有处理,或者处理不及时,有可能会对服务造成影响,因此为了避免影响服务,要尽可能将故障盘组剔除下线。现有故障RAID盘组下线及报修方法如下:步骤一:异常场景1:监控RAID盘组状态,如果有故障盘组,会发出报警到报警系统;异常场景2:监控业务指标,如果发现业务指标异常,会发出报警到报警系统;步骤二:运维人员收到报警,判断是否是RAID盘组状态异常或者是RAID盘组读写异常造成业务指标波动;步骤三:手动剔除故障RAID盘组;步骤四:将故障RAID盘组的详细信息收集好,提交报修申请。在实现本专利技术的过程中,发现现有技术中存在以下缺点:1、故障发现不够及时:依靠人工收到的报警发现故障显然很滞后。2、故障定位不够准确:监控RAID盘组的状态并不能完全涵盖盘组的异常情况。例如:盘组的状态正常,但是盘组的年限接近过保,会造成盘组读写异常,此时需要人工花费大量的时间来定位问题。3、剔除故障的RAID盘组不够及时:前面两点将导致故障的RAID盘组没有在第一时间进行剔除,从而造成对CDN服务的影响。4、故障RAID盘组报修不够及时:故障的RAID盘组需要人工搜集相关的异常日志信息并提交报修申请,此步骤是人工处理,受不可控因素影响很有可能会遗忘,导致故障盘组没有及时的报修,服务器上的盘组越来越少,间接性影响CDN服务。
技术实现思路
本专利技术实施例提供一种RAID盘组故障自动下线报修方法及装置,结合多项指标来判断RAID盘组是否故障;程序通过监测盘组的当前使用状态、盘组的寿命及盘组的读写性能来自动判断故障RAID盘组或者是疑似故障的RAID盘组,根据设定时间进行一次检测,故障发现及时准确。为达到上述目的,一方面,本专利技术实施例提供了一种RAID盘组故障自动下线报修方法,所述方法包括:循环遍历服务器上的RAID盘组,获取服务器上每一个RAID盘组的读写性能、状态及寿命;根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定,并根据判定结果对RAID盘组进行剔除下线;将剔除下线的RAID盘组的日志信息写入本地故障日志;根据记录的本地故障日志向报修接口发送报修报警。另一方面,本专利技术实施例提供了一种RAID盘组故障自动下线报修系统,所述装置包括:信息获取模块,用于循环遍历服务器上的RAID盘组,获取服务器上每一个RAID盘组的读写性能、状态及寿命;故障判定模块,用于根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定,并根据判定结果对RAID盘组进行剔除下线;剔除模块,用于根据判定结果对RAID盘组进行剔除下线,将剔除下线的RAID盘组的日志信息写入本地故障日志;保修报警模块,用于根据记录的本地故障日志向报修接口发送报修报警。上述技术方案具有如下有益效果:本专利技术的技术方案故障定位准确有效,杜绝因RAID盘组故障而导致CDN服务异常的情况,从源头上解决了服务异常发生的可能;能及时剔除故障的RAID盘组,及时发现后及时将其下线,避免对线上服务造成影响;及时报修故障的RAID盘组,故障的RAID盘组在服务器上下线后,及时的提交申请,大大减少了人为处理的不可控因素。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一种RAID盘组故障自动下线报修方法的流程图;图2是本专利技术实施例一种RAID盘组故障自动下线报修系统的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,是本专利技术实施例一种RAID盘组故障自动下线报修方法的流程图,所述方法包括:循环遍历服务器上的RAID盘组,获取服务器上每一个RAID盘组的读写性能、状态及寿命;并记录在线服务的RAID盘组的总数。根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定,并根据判定结果对RAID盘组进行剔除下线;具体地:根据RAID盘组的读写性能,将RAID盘组的读写性能判定为异常的RAID盘组进行剔除下线;若判定RAID盘组的读写性能没有异常,则判断RAID盘组的状态是否异常,若为异常,进一步判断如果将该RAID盘组下线后,在线服务的RAID盘组数是否大于设定阈值,如果大于,则将RAID盘组进行剔除下线;如果判定将该RAID盘组下线后,在线服务的RAID盘组数不大于设定阈值,则直接发出更换该RAID盘组的报警信息;若判定RAID盘组的状态没有异常,则判断RAID盘组的寿命是否到期,若到期,进一步判断如果将该RAID盘组下线后,在线服务的RAID盘组数是否大于设定阈值,如果大于,则将RAID盘组进行剔除下线;如果判定将该RAID盘组下线后,在线服务的RAID盘组数不大于设定阈值,则直接发出更换该RAID盘组的报警信息。将剔除下线的RAID盘组的信息写入本地故障日志;根据本地故障日志记录向报修接口发送报修报警;具体地,定时检测本地故障日志,若有新增的日志信息,则根据新增的日志信息向报修接口发送报修报警。对应于上述方法,如图2所示,是本专利技术实施例一种RAID盘组故障自动下线报修系统的结构示意图,所述装置包括:信息获取模块11,用于循环遍历服务器上的RAID盘组,获取服务器上每一个RAID盘组的读写性能、状态及寿命;故障判定模块12,用于根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定;剔除模块13,用于根据判定结果对RAID盘组进行剔除下线,将剔除下线的RAID盘组的日志信息写入本地故障日志;保修报警模块14,用于根据记录的本地故障日志向报修接口发送报修报警。优选地,所述信息获取模块11还用于,在循环遍历服务器上的RAID盘组时,记录在线服务的RAID盘组的总数。优选地,所述故障判定模块12具体用于:根据RAID盘组的读写性能,将R本文档来自技高网
...

【技术保护点】
1.一种RAID盘组故障自动下线报修方法,其特征在于,包括:/n循环遍历服务器上的RAID盘组,获取服务器上每一个RAID盘组的读写性能、状态及寿命;/n根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定,并根据判定结果对RAID盘组进行剔除下线;/n将剔除下线的RAID盘组的日志信息写入本地故障日志;/n根据记录的本地故障日志向报修接口发送报修报警。/n

【技术特征摘要】
1.一种RAID盘组故障自动下线报修方法,其特征在于,包括:
循环遍历服务器上的RAID盘组,获取服务器上每一个RAID盘组的读写性能、状态及寿命;
根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定,并根据判定结果对RAID盘组进行剔除下线;
将剔除下线的RAID盘组的日志信息写入本地故障日志;
根据记录的本地故障日志向报修接口发送报修报警。


2.如权利要求1所述的RAID盘组故障自动下线报修方法,其特征在于,还包括:在循环遍历服务器上的RAID盘组时,记录在线服务的RAID盘组的总数。


3.如权利要求2所述的RAID盘组故障自动下线报修方法,其特征在于,所述根据RAID盘组的读写性能、状态及寿命对每一个RAID盘组进行判定,并根据判定结果对RAID盘组进行剔除下线,包括:
根据RAID盘组的读写性能,将RAID盘组的读写性能判定为异常的RAID盘组进行剔除下线;
若判定RAID盘组的读写性能没有异常,则判断RAID盘组的状态是否异常,若为异常,进一步判断如果将该RAID盘组下线后,在线服务的RAID盘组数是否大于设定阈值,如果大于,则将RAID盘组进行剔除下线;
若判定RAID盘组的状态没有异常,则判断RAID盘组的寿命是否到期,若到期,进一步判断如果将该RAID盘组下线后,在线服务的RAID盘组数是否大于设定阈值,如果大于,则将RAID盘组进行剔除下线。


4.如权利要求3所述的RAID盘组故障自动下线报修方法,其特征在于,还包括:
对于状态异常或寿命到期的RAID盘组,如果判定将该RAID盘组下线后,在线服务的RAID盘组数不大于设定阈值,则直接发出更换该RAID盘组的报警信息。


5.如权利要求4所述的RAID盘组故障自动下线报修方法,其特征在于,所述根据记录的本地故障日志向报修接口发送报修报警,包括:
定时检测本地故障日志,若有新增的日志信息,则根据新增的日志信息向报修接口发送报修报警。
...

【专利技术属性】
技术研发人员:白淑贤李国平李源邱春武白成刚
申请(专利权)人:新浪网技术中国有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1