一种基于声音数据特征的数据中心设备故障检测方法技术

技术编号:37211634 阅读:13 留言:0更新日期:2023-04-20 23:01
本发明专利技术涉及一种基于声音数据特征的数据中心设备故障检测方法,与现有技术相比解决了难以针对数据中心设备硬件进行故障监测的缺陷。本发明专利技术包括以下步骤:收集数据中心设备运行声音;进行分类模型训练;数据中心设备运行声音的实时采集;数据中心设备故障的检测。本发明专利技术利用声音数据实现了对数据中心硬件设备故障的实时监测与告警。故障的实时监测与告警。故障的实时监测与告警。

【技术实现步骤摘要】
一种基于声音数据特征的数据中心设备故障检测方法


[0001]本专利技术涉及声音信号处理
,具体来说是一种基于声音数据特征的数据中心设备故障检测方法。

技术介绍

[0002]数据中心内设备数量与种类多、面积大,通过运维监控系统自动化的对数据中心运行状况进行监控十分必要。现有技术中,主要通过两种方式对数据中心进行监控。其一是通过在服务器的操作系统中部署监控采集agent,实现对操作系统运行状况的监控;其二是通过各种网络协议对设备或应用开放的数据接口采集数据实现监控,如通过snmp监控网络设备或通过http、jmx等协议监控应用中间件的运行。然而这两种方式都是对操作系统或设备软件运行状况的监控,对硬件的故障及损坏情况无法捕捉到。
[0003]部分硬件设备支持IPMI口对硬件传感器的监控,如温度、电压、电源、风扇转速等,但是也无法准确的对硬件的故障信息提供告警。同时由于IPMI端口与业务口隔离,存在着需要额外布线及网络配置的问题。
[0004]因此,如何提供一种通用的、快速的、可以准确对所有设备硬件故障实时捕获的系统,成了亟待解决的难题。

技术实现思路

[0005]本专利技术的目的是为了解决现有技术中难以针对数据中心设备硬件进行故障监测的缺陷,提供一种基于声音数据特征的数据中心设备故障检测方法来解决上述问题。
[0006]为了实现上述目的,本专利技术的技术方案如下:
[0007]一种基于声音数据特征的数据中心设备故障检测方法,包括以下步骤:
[0008]收集数据中心设备运行声音:将拾音器置于所有机柜各U位边缘,实时采集并上传音频数据,对机柜外的独立硬件设备单独布署拾音器进行数据采集;
[0009]进行分类模型训练:对收集的数据中心设备运行声音进行分类模型训练;
[0010]数据中心设备运行声音的实时采集:使用拾音器采集数据中心环境中的声音,将采集到的声音数字化,并通过Fbank算法提取fbank特征;
[0011]数据中心设备故障的检测:将提取的fbank特征输入训练后的声音故障识别模型,得到数据中心设备故障检测结果。
[0012]所述进行分类模型训练包括以下步骤:
[0013]获取已连续采集两年的数据中心已有类型及型号的设备音频wav数据与设备硬件故障数据作为声音样本数据,其中音频数据与设备硬件故障信息由同一套系统收集,包含精确到毫秒的时间戳;
[0014]对声音样本数据,按实际告警时间提取设备硬件故障的音频数据进行故障标注,同时对正常运行与关机状态进行标注,形成数据集;
[0015]将数据集按90:5:5比例分成训练集、验证集与测试集;
[0016]通过fbank算法对训练集提取fbank特征;
[0017]基于卷积神经网络构建声音故障识别模型:
[0018]设定卷积神经网络由2个卷积层、1个池化层、1个全连接层、1个输出层组成,通过softmax算法将结果映射到不同分类,softmax表达式公式如下,
[0019][0020]其中p
i
为第i类的概率,z
i
是全连接层的第i类的输出,z
j
是全连接层第j类的输出,总分类数为k;
[0021]将fbank特征输入声音故障识别模型进行训练;
[0022]使用验证集与测试集进行分类测试,准确率均达到98%后结束训练,得到训练后的声音故障识别模型。
[0023]所述通过fbank算法对训练集提取fbank特征包括以下步骤:
[0024]对语音信号进行预加重,以增强语音信号中的高频部分,预加重系数a选择0.97,公式如下:
[0025]y(n)=x(n)

a*x(n

1);
[0026]其中,x(n)为语音信号,y(n)为预加重后的信号;
[0027]对音频文件进行分帧,信号采样频率为8khz,帧长度选择128个采样点;
[0028]对每一帧使用Hamming窗进行加窗;
[0029]对加窗的结果进行快速傅里叶变幻得到频谱上的能量分布,频谱的计算公式为:
[0030][0031]功率谱的计算公式为:
[0032][0033]其中,若时域信号是s(n),N设为256,s(k)为频谱,p(k)为功率谱;
[0034]将能量频谱通过梅尔滤波器得到梅尔频谱,对梅尔频谱的能量数值取对数得到fbank特征。
[0035]有益效果
[0036]本专利技术的一种基于声音数据特征的数据中心设备故障检测方法,与现有技术相比利用声音数据实现了对数据中心硬件设备故障的实时监测与告警。
[0037]本专利技术通过将声音采集器直接布置在机柜上,不需要对设备进行拆机,也不必在设备系统内安装监控程序,实施效率高无风险;通过fbank算法对音频文件进行特征提取,fbank以类似于人耳的方式去处理声音,能有效提高处理的性能;同时基于卷积神经网络对fbank提取的特征进行训练,由于设备硬件故障类别较少,对较多的数据进行训练后,分类准确率高。
[0038]本专利技术中的数据中心设备故障检测方法,可以实现24小时全自动硬件设备故障监测,在软件业务系统的监控之外,补足了现有监控系统对硬件监控能力不足的短板。而且分
类效果好、故障识别准确率高、误报少,有效提高了运维人员的工作效率,降低数据中心运营成本。
附图说明
[0039]图1为本专利技术的方法顺序图;
[0040]图2为本专利技术的神经网络训练流程图。
具体实施方式
[0041]为使对本专利技术的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
[0042]如图1所示,一种基于声音数据特征的数据中心设备故障检测方法,包括以下步骤:
[0043]第一步,收集数据中心设备运行声音:将拾音器置于所有机柜各U位边缘,实时采集并上传音频数据,对机柜外的独立硬件设备单独布署拾音器进行数据采集。
[0044]第二步,进行分类模型训练:对收集的数据中心设备运行声音进行分类模型训练。如图2所示,进行分类模型训练包括以下步骤:
[0045](1)获取已连续采集两年的数据中心已有类型及型号的设备音频wav数据与设备硬件故障数据作为声音样本数据,其中音频数据与设备硬件故障信息由同一套系统收集,包含精确到毫秒的时间戳。
[0046](2)对声音样本数据,按实际告警时间提取设备硬件故障的音频数据进行故障标注,同时对正常运行与关机状态进行标注,形成数据集。
[0047](3)将数据集按90:5:5比例分成训练集、验证集与测试集。
[0048](4)通过fbank算法对训练集提取fbank特征。
[0049](5)基于卷积神经网络构建声音故障识别模型:
[0050]设定卷积神经网络由2个卷积层、1个池化层、1个全连接层、1个输出层组成,通过本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于声音数据特征的数据中心设备故障检测方法,其特征在于,包括以下步骤:11)收集数据中心设备运行声音:将拾音器置于所有机柜各U位边缘,实时采集并上传音频数据,对机柜外的独立硬件设备单独部署拾音器进行数据采集;12)进行分类模型训练:对收集的数据中心设备运行声音进行分类模型训练;13)数据中心设备运行声音的实时采集:使用拾音器采集数据中心环境中的声音,将采集到的声音数字化,并通过Fbank算法提取fbank特征;14)数据中心设备故障的检测:将提取的fbank特征输入训练后的声音故障识别模型,得到数据中心设备故障检测结果。2.根据权利要求1所述的一种基于声音数据特征的数据中心设备故障检测方法,其特征在于,所述进行分类模型训练包括以下步骤:21)获取已连续采集两年的数据中心已有类型及型号的设备音频wav数据与设备硬件故障数据作为声音样本数据,其中音频数据与设备硬件故障信息由同一套系统收集,包含精确到毫秒的时间戳;22)对声音样本数据,按实际告警时间提取设备硬件故障的音频数据进行故障标注,同时对正常运行与关机状态进行标注,形成数据集;23)将数据集按90:5:5比例分成训练集、验证集与测试集;24)通过fbank算法对训练集提取fbank特征;25)基于卷积神经网络构建声音故障识别模型:设定卷积神经网络由2个卷积层、1个池化层、1个全连接层、1个输出层组成,通过sof...

【专利技术属性】
技术研发人员:谢飞丁正刘宇姚本初刘胜军
申请(专利权)人:合肥城市云数据中心股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1