一种用于数据中心的机房故障检测方法技术

技术编号:28978057 阅读:27 留言:0更新日期:2021-06-23 09:23
本发明专利技术提供了一种用于数据中心的机房故障检测方法,包括:基于数据采集平台,获得数据中心中各个设备的检测数据,并发送至故障检测平台;基于故障检测平台,对检测数据进行分析,得到异常数据;对异常数据进行分析,确定发生故障的设备,并进行报警提醒;对所述发生故障的设备进行分析,确定发生故障的类型;通过采集数据,确定故障发生的设备和故障发生的类型,辅助对后续的故障维修,免去工作人员的排查,提高检测效率。

【技术实现步骤摘要】
一种用于数据中心的机房故障检测方法
本专利技术涉及故障检测领域,具体涉及一种用于数据中心的机房故障检测方法。
技术介绍
机房普遍指的是电信、网通、移动、双线、电力以及政府或者企业等,存放服务器的,为用户以及员工提供IT服务的地方。目前机房故障的检测通常是利用视频监控或传感器报警,可能造成故障检测出现误判等情况,并且像一些不能由传感器直接检测获得的故障,若发生故障,需要由工作人员进行逐个排查,会浪费大量的人力和时间,导致故障维修的效率低下。
技术实现思路
针对上述所显示出来的问题,本专利技术提供了一种用于数据中心的机房故障检测方法,通过采集数据,确定故障发生的设备和故障发生的类型,辅助对后续的故障维修,免去工作人员的排查,提高检测效率。本专利技术提供一种一种用于数据中心的机房故障检测方法,包括:步骤1:基于数据采集平台,获得数据中心中各个设备的检测数据,并发送至故障检测平台;步骤2:基于故障检测平台,对检测数据进行分析,得到异常数据;步骤3:对异常数据进行分析,确定发生故障的设备,并进行本文档来自技高网...

【技术保护点】
1.一种用于数据中心的机房故障检测方法,其特征在于,包括:/n步骤1:基于数据采集平台,获得数据中心中各个设备的检测数据,并发送至故障检测平台;/n步骤2:基于故障检测平台,对检测数据进行分析,得到异常数据;/n步骤3:对异常数据进行分析,确定发生故障的设备,并进行报警提醒;/n步骤4:对所述发生故障的设备进行分析,确定发生故障的类型。/n

【技术特征摘要】
1.一种用于数据中心的机房故障检测方法,其特征在于,包括:
步骤1:基于数据采集平台,获得数据中心中各个设备的检测数据,并发送至故障检测平台;
步骤2:基于故障检测平台,对检测数据进行分析,得到异常数据;
步骤3:对异常数据进行分析,确定发生故障的设备,并进行报警提醒;
步骤4:对所述发生故障的设备进行分析,确定发生故障的类型。


2.根据权利要求1所述的一种用于数据中心的机房故障检测方法,其特征在于,步骤1中,获得数据中心中各个设备的检测数据,并发送至故障检测平台包括:
基于数据采集平台在各个设备中设置与对应设备相匹配的数据采集单元;
基于所述数据采集平台,控制所述数据采集单元进行数据采集,获取采集数据,并获取所述采集数据所对应设备的设备类型,生成特定标识;
将所述采集数据与对应的特定标识进行组合,得到检测数据,并发送至故障检测平台。


3.根据权利要求1所述的一种用于数据中心的机房故障检测方法,其特征在于,步骤2中,基于故障检测平台,对检测数据进行分析,得到异常数据包括:
对所述检测数据进行特征提取,得到特征集合,并将所述特征集合输入至异常检测模型中,得到输出结果,获得所述输出结果所对应的检测数据,作为异常数据;
对所述异常数据进行分析,获得所述异常数据的存在时长、出现次数;
判断所述存在时长是否大于预设时长,或所述出现次数大于预设次数;
若是,对所述异常数据进一步检测;
否则,不对所述异常数据进行任何操作。


4.根据权利要求3所述的一种用于数据中心的机房故障检测方法,其特征在于,所述异常检测模型的建立过程如下:
获取各个设备中每个数据采集单元下的检测数据的正常数据范围;
基于所述故障检测平台,获取历史检测数据,并按照数据采集单元采集的数据类型对所述历史检测数据进行分类,获得分类数据,提取出所述分类数据中不在正常数据范围内的数据,作为历史异常数据;
获得所述历史异常数据、正常数据范围之间的关系,并基于所述关系建立初步分类模型;
将包含异常数据的历史检测数据进行随机划分,分为多组数据组;
分别将多组数据组作为训练样本,输入至初步分类模型中进行多次训练,得到多个检测模型,并获取每个检测模型的输出结果为历史异常数据的概率;
从多个检测模型选择输出结果为历史异常数据的概率最大的检测模型,并判断输出结果为历史异常数据的概率是否大于预设概率;
若是,将所述检测模型作为异常检测模型;
否则,对所述检测模型进行修正,重新训练,直到所述历史异常数据的概率大于预设概率,并将调整后的检测模型作为异常检测模型。


5.根据权利要求1所述的一种用于数据中心的机房故障检测方法,其特征在于,步骤3中,对异常数据进行分析,确定发生故障的设备,并进行报警提醒包括:
对所述异常数据进行解析,获得采集数据和特定标识;
基于所述特定标识,确定采集所述异常数据的设备类型,即为发生故障的设备类型;
基于故障检测平台,获取所述设备类型下的第一设备;
获取所述第一设备下的第一数据采集单元,获取与所述采集数据相匹配的第二数据采集单元;
将所述第一数据采集单元与所述第二数据采集单元进行对比,获得同时属于第一数据采集单元和第二数据采集单元的第三数据采集单元;
所述第三数据采集单元所检测的设备,即为发生故障的设备;
基于故障检测平台,获取所述发生故障的设备的具体位置信息并进行显示,且进行报警提醒。


6.根据权利要求1所述的一种用于数据中心的机房故障检测方法,其特征在于,步骤4中,对所述发生故障的设备进行分析,确定发生故障的类型包括:
获取所述发生故障的设备的参数信息,从设备故障数据库中获取与所述参数信息匹配的相关设备,并获取所述相关设备的第一故障类型集合;
基于述发生故障的设备...

【专利技术属性】
技术研发人员:赵希峰
申请(专利权)人:北京中大科慧科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1