一种硬盘监控系统以及监控方法技术方案

技术编号:19857233 阅读:45 留言:0更新日期:2018-12-22 11:38
本申请涉一种硬盘监控系统以及监控方法,采用本申请方案,PCIE Switch驱动模块能够在硬盘链路出现异常的时候,向监控模块上报链路异常事件;监控模块在接收到PCIE Switch驱动模块上报的链路异常事件后,会主动获取的硬盘信息进行异常分析,根据异常分析的结果生成异常处理指令,指示PCIE Switch驱动模块根据异常处理指令控制PCIE Switch进行异常处理,不需要为轮询设置较小的时间间隔,不论任何时刻,只要SSD连接PCIE Switch的链路发生异常,都够使得监控模块能够及时获知该异常,并进行异常处理,提高硬盘监控的可靠性,避免造成CPU资源的浪费。

【技术实现步骤摘要】
一种硬盘监控系统以及监控方法
本申请涉及硬盘监控
,尤其涉及一种硬盘监控系统以及监控方法。
技术介绍
固态硬盘(SolidStateDrives,SSD)是使用固态电子存储芯片阵列而制成的硬盘,由控制单元和存储单元组成。SSD作为当前广泛使用的数据载体,其可靠性也越来越受到重视。对SSD进行监控,并对SSD的信息及状态进行分析,是目前预防、处理SSD故障,保证SSD的可靠性最有效的方法。非易失性存储扩展(Non-VolatileMemoryexpress,NVMe)协议是专门为SSD等高性能存储介质设计的存储协议;外围组件互联表达(peripheralcomponentinterconnectexpress,PCIE)是一种高速串行计算机扩展总线标准。现有的SSD监控方法一般是监控软件按照预设的轮询时间向NVMe驱动发送输入输出(input/output,I/O)请求以获得指定SSD的状态信息和SMART信息,然后将SSD的状态信息和自动检测分析及报告技术(Self-MonitoringAnalysisandReportingTechnology,SMART)信息返回给监控软件;其中,SSD的状态信息包括:设备类型、设备路径、别名、设备状态、使用寿命估计等;SMART信息是硬盘自检系统保留的硬盘硬件信息,如数据读写技术、可用/已用空间、温度、在线时长、上电次数、临界报警信息、SMART状态等。监控软件会根据获得的SSD的状态信息和SMART信息进行分析,获得监控结果;若SSD的监控结果正常,则监控软件睡眠指定时间;若SSD的监控结果异常,则根据异常的种类对SSD进行修复、报警、禁用或者更换等操作。但是由于当前SSD监控方法是采用监控软件轮询,轮询的时间间隔不易确定;若轮询间隔小,会造成中央处理器(CentralProcessingUnit,CPU)资源的浪费;若间隔大,会造成SSD异常处理不及时,硬盘监控的可靠性差。
技术实现思路
本申请实施例提供一种硬盘监控系统以及监控方法,能够在不造成CPU资源浪费的前提下,使得监控模块能够及时获知该异常,进行异常处理,提高硬盘监控的可靠性。第一方面,提供一种硬盘监控系统,该系统包括:监控模块、非易失性存储扩展NVMe驱动模块、外围组件互联扩展交换PCIESwitch驱动模块、PCIESwitch;其中,所述PCIESwitch用于和所述硬盘连接,在与所述硬盘连接的链路出现异常后发生中断,并向所述PCIESwitch驱动模块上报异常信息;接收并执行所述PCIESwitch驱动模块发送的控制指令;所述PCIESwitch驱动模块,用于在接收所述PCIESwitch发送的异常信息后生成链路异常事件,并将所述链路异常事件上报给所述监控模块;在接收到所述监控模块下发的异常处理指令后,基于所述异常处理指令向所述PCIESwitch发送控制指令,用于指示所述PCIESwitch进行异常处理;所述监控模块,用于在接收所述PCIESwitch驱动模块上报的链路异常事件后,向所述NVMe驱动模块下发硬盘信息获取请求;接收所述NVMe驱动模块根据所述硬盘信息获取请求反馈的硬盘信息,基于所述硬盘信息进行异常分析,根据异常分析的结果生成异常处理指令,并将所述异常处理指令下发给所述PCIESwitch驱动模块;所述NVMe驱动模块,用于在接收到所述硬盘信息获取请求后,从所述硬盘读取硬盘信息,并将读取的所述硬盘信息反馈给所述监控模块。第二方面,提供一种硬盘监控方法,应用于硬盘监控系统中的外围组件互联扩展交换PCIESwitch驱动模块,该方法包括:接收PCIESwitch在发生中断后发送的异常信息;根据所述异常信息生成链路异常事件,并将所述链路异常事件上报给监控模块,以便所述监控模块基于所述链路异常事件从所述NVMe驱动模块获取反馈的硬盘信息,并基于所述硬盘信息生成异常处理指令,将异常处理指令下发给所述PCIESwitch驱动模块;基于所述异常处理指令向所述PCIESwitch发送控制指令,用于指示所述PCIESwitch进行异常处理。第三方面,提供一种硬盘监控方法,应用于硬盘监控系统中的监控模块,该方法包括:接收PCIESwitch驱动模块上报的链路异常事件;所述链路异常事件为PCIESwitch驱动模块在接收到PCIESwitch发生中断后发送的异常信息后生成;向所述NVMe驱动模块下发硬盘信息获取请求;所述硬盘信息获取请求用于指示所述NVMe驱动模块从所述硬盘读取硬盘信息;接收所述NVMe驱动模块根据所述硬盘信息获取请求反馈的所述硬盘信息;基于所述硬盘信息进行异常分析,根据异常分析的结果生成异常处理指令,并将所述异常处理指令下发给所述PCIESwitch驱动模块,用于所述PCIESwitch驱动模块基于所述异常处理指令向PCIESwitch发送控制指令,指示所述PCIESwitch进行异常处理。本申请实施例中,不论任何时候,一旦PCIESwitch连接SSD的链路出现异常,就会触发PCIESwitch发生中断;PCIESwitch在发生中断后向PCIESwitch驱动模块上报异常信息;PCIESwitch驱动模块在接收到PCIESwitch所发送的异常信息后,会生成对应的链路异常事件上报给监控模块。监控模块在接收到PCIESwitch驱动模块上报的链路异常事件后,会向NVMe驱动模块下发硬盘信息获取请求,以获取SSD的硬盘信息,并基于获取的硬盘信息进行异常分析,根据异常分析的结果生成异常处理指令,并将异常处理指令下发给PCIESwitch驱动模块,以使PCIESwitch驱动模块根据异常处理指令向PCIESwitch下发控制指令,控制PCIESwitch进行异常处理,不需要为轮询设置较小的时间间隔,不论任何时刻,只要SSD连接PCIESwitch的链路发生异常,都能够使得监控模块及时获知该异常,并进行异常处理,提高硬盘监控的可靠性,避免造成CPU资源的浪费。附图说明为了更加清楚地说明本申请实施例或者现有技术中的技术方案,下面将对本申请实施例或者现有技术描述中所需要的附图做简单的介绍。显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种硬盘监控系统的结构示意图;图2为本申请实施例提供的一种硬盘监控方法的流程图;图3为本申请实施例提供的将链路异常事件上报给监控模块的方法流程图;图4为本申请实施例提供的另一种硬盘监控方法的流程图;图5为本申请实施例提供的另一种硬盘监控方法的流程图;图6为本申请实施例提供的硬盘监控装置600的结构示意图;图7为本申请实施例提供的硬盘监控装置700的结构示意图;图8为本申请实施例提供的一种计算机设备800的结构示意图;图9为本申请实施例提供的另一种计算机设备900的结构示意图。具体实施方式与现有技术通过定时向NVMe驱动发送I/O请求,以实现周期性对SSD的监测不同,在本申请实施例中,PCIESwitch驱动模块能够在硬盘链路出现异常的时候,向监控模块上报链路异常事件;监控模块在接收到PCIESwitch驱动模块上报的链路异常事件后,会主动获取的硬盘本文档来自技高网
...

【技术保护点】
1.一种硬盘监控系统,其特征在于,该系统包括:监控模块、非易失性存储扩展NVMe驱动模块、外围组件互联扩展交换PCIE Switch驱动模块、PCIE Switch;其中,所述PCIE Switch用于和所述硬盘连接,在与所述硬盘连接的链路出现异常后发生中断,并向所述PCIE Switch驱动模块上报异常信息;接收并执行所述PCIE Switch驱动模块发送的控制指令;所述PCIE Switch驱动模块,用于在接收所述PCIE Switch发送的异常信息后生成链路异常事件,并将所述链路异常事件上报给所述监控模块;在接收到所述监控模块下发的异常处理指令后,基于所述异常处理指令向所述PCIE Switch发送控制指令,用于指示所述PCIE Switch进行异常处理;所述监控模块,用于在接收所述PCIE Switch驱动模块上报的链路异常事件后,向所述NVMe驱动模块下发硬盘信息获取请求;接收所述NVMe驱动模块根据所述硬盘信息获取请求反馈的硬盘信息,基于所述硬盘信息进行异常分析,根据异常分析的结果生成异常处理指令,并将所述异常处理指令下发给所述PCIE Switch驱动模块;所述NVMe驱动模块,用于在接收到所述硬盘信息获取请求后,从所述硬盘读取硬盘信息,并将读取的所述硬盘信息反馈给所述监控模块。...

【技术特征摘要】
1.一种硬盘监控系统,其特征在于,该系统包括:监控模块、非易失性存储扩展NVMe驱动模块、外围组件互联扩展交换PCIESwitch驱动模块、PCIESwitch;其中,所述PCIESwitch用于和所述硬盘连接,在与所述硬盘连接的链路出现异常后发生中断,并向所述PCIESwitch驱动模块上报异常信息;接收并执行所述PCIESwitch驱动模块发送的控制指令;所述PCIESwitch驱动模块,用于在接收所述PCIESwitch发送的异常信息后生成链路异常事件,并将所述链路异常事件上报给所述监控模块;在接收到所述监控模块下发的异常处理指令后,基于所述异常处理指令向所述PCIESwitch发送控制指令,用于指示所述PCIESwitch进行异常处理;所述监控模块,用于在接收所述PCIESwitch驱动模块上报的链路异常事件后,向所述NVMe驱动模块下发硬盘信息获取请求;接收所述NVMe驱动模块根据所述硬盘信息获取请求反馈的硬盘信息,基于所述硬盘信息进行异常分析,根据异常分析的结果生成异常处理指令,并将所述异常处理指令下发给所述PCIESwitch驱动模块;所述NVMe驱动模块,用于在接收到所述硬盘信息获取请求后,从所述硬盘读取硬盘信息,并将读取的所述硬盘信息反馈给所述监控模块。2.根据权利要求1所述的系统,其特征在于,所述异常处理包括以下处理中的一种或多种:控制故障硬盘对应的指示灯点亮;故障链路禁用;故障链路复位。3.根据权利要求1所述的系统,其特征在于,所述PCIESwitch驱动模块,具体用于通过下述步骤将所述链路异常事件上报给所述监控模块:建立所述PCIESwitch驱动模块与所述监控模块之间的网络链路Netlink通道;所述Netlink通道定义了所述PCIESwitch驱动模块与所述监控模块之间进行通信的协议;基于建立的所述Netlink通道将所述链路异常事件上报给所述监控模块。4.根据权利要求1所述的系统,其特征在于,所述PCIESwitch驱动模块,具体用于根据下述步骤基于所述异常处理指令向所述PCIESwitch发送控制指令:在接收到所述异常处理指令后,调用输入输出控制IOCTL函数,将所述异常处理指令转换为所述PCIESwitch能够识别的控制指令,并将所述控制指令发送给所述PCIESwitch。5.根据权利要求1所述的系统,其特征在于,所述监控模块,还用于:周期性向所述NVMe驱动模块发送所述硬盘信息获取请求,并接收所述NVMe驱动模块根据所述硬盘信息获取请求反馈的硬盘信息;根据所述硬盘信息进行异常分析;当所述异常分析的结果为硬盘存在异常后,生成异常处理...

【专利技术属性】
技术研发人员:郑哲欣
申请(专利权)人:新华三技术有限公司成都分公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1