一种存储系统故障实时告警的方法及系统技术方案

技术编号:14458120 阅读:78 留言:0更新日期:2017-01-19 15:12
本发明专利技术公开了一种存储系统故障实时告警的方法及系统,包括当存储系统中的硬件出现故障时,生成故障事件;对故障事件按照与故障事件对应的预设数据结构进行提取封装,并将封装后的故障事件作为一个event事件,预设数据结构包括事件标示、事件描述、事件错误码、错误码信息描述以及故障上报信息,事件标示用于对故障事件进行标记,事件错误码用于提供故障事件的修复措施,故障上报信息用于作为对故障事件对应的硬件进行定位的依据;将event事件上报至GUI;GUI对event事件进行解析,获取故障事件原因并进行显示。本发明专利技术将硬件及其可能产生的错误同GUI联系起来,对产生的故障进行及时实时告警,实现及时修复,提高了存储系统的安全性能。

【技术实现步骤摘要】

本专利技术涉及存储系统故障告警
,特别是涉及一种存储系统故障实时告警的方法及系统。
技术介绍
在对服务器存储系统进行设计时,存储系统中硬件部件功能的稳定决定着存储系统的性能,对硬件部件功能的实时监视告警和修复对优化存储系统整体性能有着很大的作用。存储系统中关于硬件部件异常故障诸如控制器连接配置异常、节点丢失或者关闭、容器温度过高以及风扇电源寿命到期等问题,现有技术中的通常应对措施是定期的测试硬件功能各指标是否达标,用于避免故障的突然发生,然而这样的预防对于存储系统的故障告警并没有很好的效果。如果硬件在上次测试以及下次测试之间出现故障,也即在这之间正常工作的过程中发现存储系统出现异常,进而再去进行维修,没有时效性,不能做到及时地进行故障告警,更有可能对整个储存系统的硬件部件造成严重的损害。因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
技术实现思路
本专利技术的目的是提供一种存储系统故障实时告警的方法,将硬件及其可能产生的错误同GUI联系起来,从而对产生的故障进行及时实时告警,最终实现及时修复,提高了存储系统的安全性能;本专利技术的另一目的是提供一种存储系统故障实时告警的系统。为解决上述技术问题,本专利技术提供了一种存储系统故障实时告警的方法,包括:当存储系统中的硬件出现故障时,生成故障事件;对所述故障事件按照与所述故障事件对应的预设数据结构进行提取封装,并将封装后的故障事件作为一个event事件;其中,所述预设数据结构包括事件标示、事件描述、事件错误码、错误码信息描述以及故障上报信息,其中,所述事件标示用于对所述故障事件进行标记,所述事件错误码用于提供所述故障事件的修复措施,所述故障上报信息包括所述故障事件的版本号和故障描述信息,用于作为对所述故障事件对应的硬件进行定位的依据;将所述event事件上报至GUI;所述GUI对所述event事件进行数据结构解析,获取故障事件原因并进行显示。优选地,该方法还包括:在上报的故障未被修复之前阻止同类事件的多次上报。优选地,该方法还包括:在无故障事件上报时,所述GUI采用定时轮询发送请求方式查询所述存储系统的硬件设备状态,并依据预设协议的关键字更新缓存中的硬件设备状态信息。优选地,该方法还包括:所述GUI在对所述硬件设备状态进行显示时,首先从所述缓存中读取当前硬件设备状态,对于所述缓存中没有的记录,则主动向所述存储系统发送查询请求。优选地,一个所述事件标示唯一对应一个所述事件错误码。优选地,所述故障上报信息采用ASCII形式存放。优选地,该方法还包括:当GUI接收到多个event事件时,GUI按照预设优先级对多个event事件进行数据结构解析,获取故障事件原因并进行显示。为解决上述技术问题,本专利技术还提供了一种存储系统故障实时告警的系统,包括:故障事件生成单元,用于当存储系统中的硬件出现故障时,生成故障事件;封装单元,用于对所述故障事件按照与所述故障事件对应的预设数据结构进行提取封装,并将封装后的故障事件作为一个event事件;其中,所述预设数据结构包括事件标示、事件描述、事件错误码、错误码信息描述以及故障上报信息,其中,所述事件标示用于对所述故障事件进行标记,所述事件错误码用于提供所述故障事件的修复措施,所述故障上报信息包括所述故障事件的版本号和故障描述信息,用于作为对所述故障事件对应的硬件进行定位的依据;上报单元,用于将所述event事件上报至GUI;所述GUI,用于对所述event事件进行数据结构解析,获取故障事件原因并进行显示。本专利技术提供了一种存储系统故障实时告警的方法及系统,包括当存储系统中的硬件出现故障时,生成故障事件;对故障事件按照与故障事件对应的预设数据结构进行提取封装,并将封装后的故障事件作为一个event事件,预设数据结构包括事件标示、事件描述、事件错误码、错误码信息描述以及故障上报信息,其中,事件标示用于对故障事件进行标记,事件错误码用于提供故障事件的修复措施,故障上报信息包括故障事件的版本号和故障描述信息,用于作为对故障事件对应的硬件进行定位的依据;将event事件上报至GUI;GUI对event事件进行数据结构解析,获取故障事件原因并进行显示。可见,本专利技术能够在存储系统中的硬件发生故障时,生成故障事件,并将故障事件按照与故障事件对应的预设数据结构进行提取封装,并上报GUI,完成与GUI的交互,将硬件及其可能产生的错误同GUI联系起来,从而对产生的故障进行及时实时告警,最终实现及时修复,提高了存储系统的安全性能。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种存储系统故障实时告警的方法的过程的流程图;图2为本专利技术提供的一种存储系统故障实时告警的系统的结构示意图。具体实施方式本专利技术的核心是提供一种存储系统故障实时告警的方法,将硬件及其可能产生的错误同GUI联系起来,从而对产生的故障进行及时实时告警,最终实现及时修复,提高了存储系统的安全性能;本专利技术的另一核心是提供一种存储系统故障实时告警的系统。为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参照图1,图1为本专利技术提供的一种存储系统故障实时告警的方法的过程的流程图,该方法包括:步骤S101:当存储系统中的硬件出现故障时,生成故障事件;步骤S102:对故障事件按照与所述故障事件对应的预设数据结构进行提取封装,并将封装后的故障事件作为一个event事件;其中,预设数据结构包括事件标示、事件描述、事件错误码、错误码信息描述以及故障上报信息,其中,事件标示用于对故障事件进行标记,事件错误码用于提供故障事件的修复措施,故障上报信息包括故障事件的版本号和故障描述信息,用于作为对故障事件对应的硬件进行定位的依据;具体地,本申请预先对存储系统中的硬件的所有故障情况进行分析,分别对应生成故障事件,并得到各故障事件对应的预设数据结构。在实际应用中,预设数据结构包括:事件标示:event_id事件描述:event_idtext事件错误码:error_code错误码信息描述:error_code_text故障上报信息:sensedata其中,故障上报信息为16*8=128字节。作为优选地,故障上报信息采用ASCII形式存放。具体地,一个事件标示唯一对应一个事件错误码。可以理解的是,事件错误码用于提供故障事件的修复措施。不同的故障事件可能有着相同的修复措施,如电池断电故障或者电池寿命即将到期等不同的事件,均需要我们更换电池部件操作。因此故障事件与对应修复措施对应关系为:一个event_id对应唯一error_code,而一个error_code可能会对应多个event_id。步骤S103:将event事件上报至GUI本文档来自技高网...

【技术保护点】
一种存储系统故障实时告警的方法,其特征在于,包括:当存储系统中的硬件出现故障时,生成故障事件;对所述故障事件按照与所述故障事件对应的预设数据结构进行提取封装,并将封装后的故障事件作为一个event事件;其中,所述预设数据结构包括事件标示、事件描述、事件错误码、错误码信息描述以及故障上报信息,其中,所述事件标示用于对所述故障事件进行标记,所述事件错误码用于提供所述故障事件的修复措施,所述故障上报信息包括所述故障事件的版本号和故障描述信息,用于作为对所述故障事件对应的硬件进行定位的依据;将所述event事件上报至GUI;所述GUI对所述event事件进行数据结构解析,获取故障事件原因并进行显示。

【技术特征摘要】
1.一种存储系统故障实时告警的方法,其特征在于,包括:当存储系统中的硬件出现故障时,生成故障事件;对所述故障事件按照与所述故障事件对应的预设数据结构进行提取封装,并将封装后的故障事件作为一个event事件;其中,所述预设数据结构包括事件标示、事件描述、事件错误码、错误码信息描述以及故障上报信息,其中,所述事件标示用于对所述故障事件进行标记,所述事件错误码用于提供所述故障事件的修复措施,所述故障上报信息包括所述故障事件的版本号和故障描述信息,用于作为对所述故障事件对应的硬件进行定位的依据;将所述event事件上报至GUI;所述GUI对所述event事件进行数据结构解析,获取故障事件原因并进行显示。2.如权利要求1所述的存储系统故障实时告警的方法,其特征在于,该方法还包括:在上报的故障未被修复之前阻止同类事件的多次上报。3.如权利要求1所述的存储系统故障实时告警的方法,其特征在于,该方法还包括:在无故障事件上报时,所述GUI采用定时轮询发送请求方式查询所述存储系统的硬件设备状态,并依据预设协议的关键字更新缓存中的硬件设备状态信息。4.如权利要求3所述的存储系统故障实时告警的方法,其特征在于,该方法还包括:所述GUI在对所述硬件设备状态进行显示时,首先从所述缓存中读取当前硬件设备状态,对于所述缓存中没有的...

【专利技术属性】
技术研发人员:张建刚何中辰
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1