The invention discloses a method, a device and a device for detecting a breakdown in a computer room. The detected room includes a plurality of server set, each server sets a data request and the server response set satisfying the preset conditions on the processing of data requests and generate alarm information and the alarm server information including the server sets of identification, including a specific embodiment of the method: get the alarm records, scheduled time for testing the room in which the alarm records including the predetermined period of time the test room of the server set to generate alarm information; determining the first number, among them, the number for the alarm records appear in different server set identification number; the first number is determined based on the determined. Whether there is fault detection room. The embodiment of the invention improves the efficiency of determining whether or not the engine room is faulty.
【技术实现步骤摘要】
用于检测机房故障的方法、装置及设备
本申请涉及计算机
,具体涉及数据中心
,尤其涉及用于检测机房故障的方法、装置及设备。
技术介绍
互联网数据中心(IDC,InternetDataCenter)是为集中收集、存储、处理和发送数据的设备提供运行维护的设施基地并提供相关的服务的场所。互联网数据中心通常包括机房,机房中可以包括服务器集合、支持机房内/外部通信的电子设备以及其它电子设备。机房中的电子设备产生故障或出现通信障碍等情况,可以称为机房出现故障。然而,现有的检测机房故障的方式通常是测试机房中设备之间的物理连接,从而,存在着确定机房是否出现故障的效率低下的问题。
技术实现思路
本申请的目的在于提出一种改进的用于检测机房故障的方法、装置及设备,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请提供了一种用于检测机房故障的方法,待检测机房包括多个服务器集合,每个服务器集合处理一种类型的数据请求并且该服务器集合响应于所处理的数据请求满足预设条件而生成报警信息,上述报警信息包括该服务器集合的服务器集合标识,上述方法包括:获取预定时间段内待检测机房的报警记录,其中,上述报警记录包括上述预定时间段内上述待检测机房内的服务器集合生成的报警信息;确定第一数量,其中,第一数量为上述报警记录中出现的不同服务器集合标识的数量;基于所确定的第一数量,确定上述待检测机房是否出现故障。第二方面,本申请提供了一种用于检测机房故障的装置,待检测机房包括多个服务器集合,每个服务器集合处理一种类型的数据请求并且该服务器集合响应于所处理的数据请求满足预设条件而生成报警信息,上述报警信 ...
【技术保护点】
一种用于检测机房故障的方法,其特征在于,待检测机房包括多个服务器集合,每个服务器集合处理一种类型的数据请求并且该服务器集合响应于所处理的数据请求满足预设条件而生成报警信息,所述报警信息包括该服务器集合的服务器集合标识,所述方法包括:获取预定时间段内待检测机房的报警记录,其中,所述报警记录包括所述预定时间段内所述待检测机房内的服务器集合生成的报警信息;确定第一数量,其中,第一数量为所述报警记录中出现的不同服务器集合标识的数量;基于所确定的第一数量,确定所述待检测机房是否出现故障。
【技术特征摘要】
1.一种用于检测机房故障的方法,其特征在于,待检测机房包括多个服务器集合,每个服务器集合处理一种类型的数据请求并且该服务器集合响应于所处理的数据请求满足预设条件而生成报警信息,所述报警信息包括该服务器集合的服务器集合标识,所述方法包括:获取预定时间段内待检测机房的报警记录,其中,所述报警记录包括所述预定时间段内所述待检测机房内的服务器集合生成的报警信息;确定第一数量,其中,第一数量为所述报警记录中出现的不同服务器集合标识的数量;基于所确定的第一数量,确定所述待检测机房是否出现故障。2.根据权利要求1所述的方法,其特征在于,所述基于所确定的第一数量,确定所述待检测机房是否出现故障,包括:确定所述待检测机房的第一比值,其中,所述第一比值为所述第一数量与所述待检测机房中的服务器集合总数量的比值;基于所述第一比值,确定所述待检测机房是否出现故障。3.根据权利要求1所述的方法,其特征在于,报警信息还包括生成该报警信息时数据请求所满足的预设条件的条件标识;以及所述方法还包括:确定第二数量,其中,第二数量为所述报警记录中出现的不同条件标识的数量;以及所述基于所确定的第一数量,确定所述待检测机房是否出现故障,包括:基于所述第一数量和所述第二数量,确定所述待检测机房是否出现故障。4.根据权利要求3所述的方法,其特征在于,所述基于所确定的第一数量和第二数量,确定所述待检测机房是否出现故障,包括:确定所述待检测机房的第二比值,其中,所述第二比值为所述第二数量与为所述待检测机房中所有服务器集合的预设条件数量之和的比值;基于所述第一比值和所述第二比值,确定所述待检测机房是否出现故障。5.根据权利要求4所述的方法,其特征在于,所述基于所述第一比值和所述第二比值,确定所述待检测机房是否出现故障,包括:根据所述第一比值和所述第二比值,确定用于表征所述待检测机房是否出现故障的异常检测特征值;利用异常点检测算法确定所述异常检测特征值是否出现异常;响应于所述异常检测特征值出现异常,确定所述待检测机房出现故障。6.根据权利要求5所述的方法,其特征在于,所述根据所述第一比值和所述第二比值,确定用于表征所述待检测机房是否出现故障的异常检测特征值,包括:计算所述第一比值和所述第二比值的乘积;将所述乘积的平方根作为异常检测特征值。7.根据权利要求5所述的方法,其特征在于,所述利用异常点检测算法确定所述异常检测特征值是否出现异常,...
【专利技术属性】
技术研发人员:陈云,王博,郭宣佑,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。