一种暖通机房异常音频识别方法及装置制造方法及图纸

技术编号:39857061 阅读:4 留言:0更新日期:2023-12-30 12:54
本申请公开了一种暖通机房异常音频识别方法及装置,涉及暖通技术领域,通过将待识别音频的

【技术实现步骤摘要】
一种暖通机房异常音频识别方法及装置


[0001]本申请涉及暖通
,具体涉及一种暖通机房异常音频识别方法及装置


技术介绍

[0002]异常声音检测任务可以分为有监督异常声音检测和无监督异常声音检测两种类型

[0003]有监督异常声音检测需要使用已标记好的正常声音和异常声音数据集进行训练,在测试阶段,算法会将新的声音样本与已训练好的模型进行比较,从而判断其是否为异常声音

但是,在设备实际运行过程中,因设备故障而导致出现异常声音的情况非常少,并且种类不定,想要搜集详细而且大量的异常声音数据集进行训练不太现实

[0004]相反,无监督异常声音检测则不需要预先标记数据集中的正常声音和异常声音

这种方法通常基于假设,即正常声音和异常声音在频域或时域上有不同的特征,如异常声音的能量或频谱分布

算法会自动学习这些特征,并将声音分为正常和异常两类

因此,这种方法只需要采集正常声音的信号特征,无需采集异常声音样本,也不需要人工标注数据,比较适合需要自动检测异常声音的场景

[0005]但是,目前异常声音检测任务仍然存在一些不足之处:
[0006]1、
针对性不强:不同的设备具有不同的声音特性和异常声音类型,目前尚且没有在暖通场景下对特定设备有针对性的进行声音信号分析,而通用数据集,可能不会包含足够多的特定类型的异常声音,使得模型难以学习其特征,从而导致检测准确性和敏感性的降低

[0007]2、
对参数选择敏感:目前的主流声音检测模型采用
SVM
和神经网络模型来对数据进行训练和预测,但这两种方法都极其依赖于参数的选择,对
SVM
算法来说,选择不合适的核函数或调整不当的参数可能会降低
SVM
的分类性能;而对神经网络模型来说,不合适的参数设置可能会导致模型收敛速度慢

过拟合或欠拟合等问题

在实际应用中,往往需要进行大量的实验和交叉验证来选择最优的参数组合

[0008]3、
计算效率不高:现有技术往往使用复杂的声音信号处理技术和较为复杂的模型来进行分析,这会导致计算效率低下,增加系统的响应时间,无法满足实时异常检测的需求


技术实现思路

[0009]为此,本申请提供一种暖通机房异常音频识别方法及装置,以解决现有技术存在的异常声音检测方法针对性不强

算法对参数选择敏感以及计算效率不高的问题

[0010]为了实现上述目的,本申请提供如下技术方案:
[0011]第一方面,一种暖通机房异常音频识别方法,包括:
[0012]步骤1:通过巡检机器人获取设备的待识别音频,并提取所述待识别音频的
MFCC
特征;
[0013]步骤2:获取设备的正常音频数据,并提取所述正常音频数据的
MFCC
特征;
[0014]步骤3:将所述待识别音频的
MFCC
特征和所述正常音频数据的
MFCC
特征进行合并得到待分类数据集;
[0015]步骤4:采用预先训练好的
KMeans
算法对所述待分类数据集进行分类,并根据分类结果判断所述待识别音频是否异常,从而得到第一预测结果;
[0016]步骤5:采用预先训练好的孤立森林算法对所述待分类数据集进行分类,并根据分类结果分别判断所述待识别音频是否异常,从而得到第二预测结果;
[0017]步骤6:对所述第一预测结果和所述第二预测结果进行投票,根据投票结果最终确定所述待识别音频是否异常

[0018]作为优选,所述步骤1或所述步骤2中提取所述待识别音频的
MFCC
特征或所述正常音频数据的
MFCC
特征时采用
librosa
进行提取

[0019]作为优选,所述步骤1或所述步骤2中提取所述待识别音频的
MFCC
特征或所述正常音频数据的
MFCC
特征时使用汉明窗函数进行加窗

[0020]作为优选,所述步骤4中,所述
KMeans
算法的簇中心为样本的中位数

[0021]作为优选,所述
KMeans
算法中样本到簇中心的距离计算公式为加权欧式距离,所述加权欧式距离计算公式为:
[0022][0023]其中,

为样本,,,为特征
k
对应的权重,
m
为特征个数;
[0024][0025]其中,为标注差,为:
[0026][0027]其中,
n
为样本数

[0028]作为优选,所述步骤4具体为:
[0029]步骤
401
:采用预先训练好的
KMeans
算法将所述待分类数据集分为两类,并得到每个数据的预测类别标签;
[0030]步骤
402
:计算正常数据的预测类别标签平均值,并将所述平均值设定为正常标签;
[0031]步骤
403
:计算待识别数据中标签为正常标签的数据占总数据的比例;
[0032]步骤
404
:根据所述比例判断所述待识别数据是否为异常数据,从而得到第一预测结果

[0033]作为优选,所述步骤5中,所述孤立森林算法确定分割点时具体为:
[0034]计算所有样本在随机选取的特征维度下的最小值

最大值和极差;
[0035]根据所述极差去除组数得到组距;
[0036]计算各组的界限位;
[0037]统计每组数据的个数为频数,并找到频数最小的组,以其中位数为随机分割点

[0038]第二方面,一种暖通机房异常音频识别装置,包括:
[0039]异常音频特征提取模块,用于通过巡检机器人获取设备的待识别音频,并提取所述待识别音频的
MFCC
特征;
[0040]正常音频特征提取模块,用于获取设备的正常音频数据,并提取所述正常音频数据的
MFCC
特征;
[0041]特征融合模块,用于将所述待识别音频的
MFCC
特征和所述正常音频数据的
MFCC
特征进行合并得到待分类数据集;
[0042]第一预测模块,用于采用预先训练好的
KMeans
算法对所述待分类数据集进行分类,并根据分类结果判断所述待识别音频是否异常,从而得到第一预测结果;
[0043]第二预测模块,用于采用预先训练好的孤立森林算法对所述待分类数据集进行分类,并根据分类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种暖通机房异常音频识别方法,其特征在于,包括:步骤1:通过巡检机器人获取设备的待识别音频,并提取所述待识别音频的
MFCC
特征;步骤2:获取设备的正常音频数据,并提取所述正常音频数据的
MFCC
特征;步骤3:将所述待识别音频的
MFCC
特征和所述正常音频数据的
MFCC
特征进行合并得到待分类数据集;步骤4:采用预先训练好的
KMeans
算法对所述待分类数据集进行分类,并根据分类结果判断所述待识别音频是否异常,从而得到第一预测结果;步骤5:采用预先训练好的孤立森林算法对所述待分类数据集进行分类,并根据分类结果分别判断所述待识别音频是否异常,从而得到第二预测结果;步骤6:对所述第一预测结果和所述第二预测结果进行投票,根据投票结果最终确定所述待识别音频是否异常
。2.
根据权利要求1所述的暖通机房异常音频识别方法,其特征在于,所述步骤1或所述步骤2中提取所述待识别音频的
MFCC
特征或所述正常音频数据的
MFCC
特征时采用
librosa
进行提取
。3.
根据权利要求1所述的暖通机房异常音频识别方法,其特征在于,所述步骤1或所述步骤2中提取所述待识别音频的
MFCC
特征或所述正常音频数据的
MFCC
特征时使用汉明窗函数进行加窗
。4.
根据权利要求1所述的暖通机房异常音频识别方法,其特征在于,所述步骤4中,所述
KMeans
算法的簇中心为样本的中位数
。5.
根据权利要求4所述的暖通机房异常音频识别方法,其特征在于,所述
KMeans
算法中样本到簇中心的距离计算公式为加权欧式距离,所述加权欧式距离计算公式为:其中,

为样本,,,为特征
k
对应的权重,
m
为特征个数;其中,为标注差,为:其中,
n
为样本数
。6.
根据权利要求5所述的暖通机房异常音频识别方法,其特征在于,所述步骤4具体为:步骤
...

【专利技术属性】
技术研发人员:刘龙豹
申请(专利权)人:中瑞恒北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1