一种应用于异常声音检测的音频分类系统和方法技术方案

技术编号:15748530 阅读:43 留言:0更新日期:2017-07-03 08:18
本发明专利技术公开了一种应用于异常声音检测的音频分类系统和方法。音频分类是异常声音检测系统中很重要的模块。现有的音频分类方法如高斯混合模型、K近邻等,检测率比较低,无法满足实际需要。针对这种情况,本发明专利技术提出了一种使用潜在概率语义(PLSA)模型和K近邻分类器的音频分类系统。在该系统中,先将信号特征向量送入潜在概率语义模型中训练,获得声音主题词袋模型,然后使用K近邻分类器(KNN)进行分类,最后系统获得分类后的音频文件。与传统的使用K近邻分类器的音频分类系统相比,本发明专利技术所提出的音频分类系统和方法取得了更好的分类效果。

【技术实现步骤摘要】
一种应用于异常声音检测的音频分类系统和方法
本专利技术涉及一种音频分类系统,尤其是涉及一种在异常声音检测系统中提高了分类准确率的音频分类系统。
技术介绍
音频分类是异常声音检测系统中的重要模块,可以依据音频特征将不同的音频信号区分开来。目前,影响异常声音检测的主要瓶颈仍然存在,在分类方面主要表现在传统上的异常声音检测分类方法如GMM(高斯混合模型),HMM(隐马尔科夫模型)等方法,检测率比较低,虚警率高,无法满足实际需要。因此,亟需一种新的音频分类系统来提高异常声音检测系统中音频分类的准确率,进而改善异常声音检测系统的性能。
技术实现思路
(一)要解决的技术问题本专利技术的目的是改善异常声音检测系统中音频分类的准确率。本专利技术提供了一种采用潜在概率语义模型和k近邻分类器的音频分类系统。该系统在音频分类方面取得了更高的准确率。(二)技术方案一种应用于异常声音检测的音频分类系统,包括特征提取与处理模块、潜在概率语义模型模块和分类器模块;所述特征提取与处理模块用于提取语音的音频信号特征,并构建词-频共现矩阵;所述潜在概率语义模型模块用于对词-频共现矩阵进行处理,得到声音主题词袋模型;所述分类器模块对比声音主题词袋模型,对音频信号进行分类。优选地,所述语音包括训练语音和测试语音;所述分类器模块对比训练语音和测试语音的声音主题词袋模型,对测试语音的音频信号进行分类。优选地,提取音频信号特征时选择提取12维的梅尔频率倒谱系数和12维的一阶梅尔频率倒谱系数,构建24维的特征向量矩阵。优选地,提取音频信号特征的过程包括:预加重、端点检测、分帧、加窗、快速傅里叶变换、Mel频率滤波和离散余弦变换。优选地,所述潜在概率语义模型对词-频共现矩阵进行降维,映射到低维的潜在语义空间,从而消除音频帧的同义词和多义词影响。优选地,采用EM算法求解潜在概率语义模型的参数,得到潜在主题类别在输入的音频文件下的条件概率,获得声音主题词袋模型。优选地,所述分类器为K近邻分类器。优选地,所述K近邻分类器将输入的声音主题词袋模型使用多数表决规则进行分类,得出分类结果。一种应用于异常声音检测的音频分类方法,包括以下步骤:S1:提取音频信号特征,并构建词-频共现矩阵;S2:利用潜在概率语义模型对词-频共现矩阵进行处理,得到声音主题词袋模型;S3:对比声音主题词袋模型,对音频信号进行分类。(三)有益效果本专利技术综合了潜在概率语义模型和传统的k近邻分类器构建了一个音频分类系统。该系统应用于异常声音检测系统,能够有效地改善异常声音系统的性能,增加对异常声音的进行分类的准确率,使相关部门能够及时准确的做出判断和处理,从而减少或者降低不法行为发生的风险。附图说明图1为本专利技术实施例的应用于异常声音检测的音频分类系统示意图;图2为本专利技术实施例的特征提取流程图;图3为本专利技术实施例的潜在概率语义模型的映射关系图;图4为本专利技术实施例的应用于异常声音检测的音频分类方法流程图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术作进一步的详细说明。本专利技术中的音频分类系统在提取音频信号特征以后不立即进行分类,而是先送入PLSA概率语义模型获取声音主题词袋模型,降低语音信号特征矩阵的维数,再选择合适的分类器进行分类,能够为异常声音检测系统提供更好的分类性能。本专利技术第一实施例提供一种应用于异常声音检测的音频分类系统,图1为本专利技术实施例的应用于异常声音检测的音频分类系统示意图,如图1所示,系统主要分为三个部分:特征提取与处理模块1,潜在概率语义模型模块2和分类器模块3。特征提取与处理模块1用于提取音频信号特征,并构建每个音频文件的词-频共现矩阵。音频文件分为训练语音片段数据和测试语音片段数据,对音频信号特征的提取有时域分析、频域分析和倒谱分析。由于梅尔频率倒谱系数(MFCC)参数含有语义信息,并结合了人耳听觉感知特性与语音信号的产生机制,具有良好的识别能力和抗噪性能,而差分倒谱系数MFCC描述了两个音频帧之间的关联,体现了帧与帧之间的信息量。因此本实施例在提取音频信号特征时选择提取12维的梅尔频率倒谱系数(MFCC系数)和12维的一阶梅尔频率倒谱系数(MFCC一阶差分系数),构建24维的特征向量矩阵。图2为本专利技术实施例的特征提取流程图,如图2所示,提取音频信号特征的过程包括:预加重、端点检测、分帧、加窗、快速傅里叶变换FFT、Mel频率滤波和离散余弦变换DCT等步骤。预加重可以提升高频段的能量,使频谱平坦化。端点检测主要是从背景噪音中找到有效的声音部分,确定其起止点,并将噪声部分去除,以减少声音信号的处理时间。分帧就是把声音信号分割为一个个的短时间范围信号,每帧长度为10到30毫秒。在分帧时将前一帧的帧尾与后一帧的帧头相重叠可以保证平滑过渡。在不加窗的情况下,由于截断效应,所选取的音频帧的采样点将会迅速的变化,形成较大的坡度,加窗处理后可以保证平滑过渡,Mel频率滤波部分包括Mel尺度三角形滤波器组。对于每一个提取到的音频信号特征向量集共同组成全部特征集合,然后计算每一个音频文件在这个集合中出现的频率,最后得到一个由每一个音频文件在全部特征集合中出现的频率构成的词-频共现矩阵。潜在概率语义模型模块接收特征提取与处理模块输出的词-频共现矩阵,利用潜在概率语义模型对其进行求解,获得声音主题词袋模型。潜在概率语义模型(ProbabilisticLatentSemanticAnalysis,PLSA)是一种无监督学习模型,PLSA的模型描述基于多项式分布假设,它的优化目标是使KL-divergence最小,而不依赖最小均方误差准则。PLSA模型通过对音频文档中建立的词-频共现矩阵进行降维,映射到低维的潜在语义空间,从而获得声音主题词袋模型。图3为本专利技术实施例的潜在概率语义模型的映射关系图,如图3所示,音频文档映射到相应主题类别,对应到不同的音频帧,从更深的层次上发现了词汇间的语义联系,这种特点使得PLSA模型可以解决文档中存在的同义词和异义词的问题,能够消除音频帧的同义词和多义词影响,在更深层次上发现音频文件与潜在主题类别之间的关系。因为这个优势,将PLSA模型应用到了本系统中用来消除重复的音频帧的影响。在本实施例中,将词-频共现矩阵送入潜在概率语义模型中进行训练,采用EM算法求解PLSA模型的参数,得到潜在主题类别在输入的音频文件下的条件概率,即获得训练语音的声音主题词袋模型。同样的,待分类的音频文件也得到一个条件概率,获得测试语音的声音主题词袋模型。分类器模块是音频分类系统的最后一步,在这一步中,主要将训练语音的声音主题词袋模型和测试语音的主题词袋模型做出对比,最后得到分类后的结果。使用合适的分类器进行分类。本专利技术实施例选择的是K近邻分类器。K近邻(k-nearestneighbor,KNN)是一种基本分类与回归方法。如果给定一个训练数据集,对于新的输入实例,在训练数据集中找到与该实例最近邻的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。在k近邻空间中,两个实例点间相似的程度可以由实例点间的距离反映出来。常用的距离有欧氏距离、Lp距离、Minkowski距离三种,本系统中选择的是常用的欧氏距离。本实施例中使用了K近邻分类本文档来自技高网...
一种应用于异常声音检测的音频分类系统和方法

【技术保护点】
一种应用于异常声音检测的音频分类系统,其特征在于,包括特征提取与处理模块、潜在概率语义模型模块和分类器模块;所述特征提取与处理模块用于提取语音的音频信号特征,并构建词‑频共现矩阵;所述潜在概率语义模型模块用于对词‑频共现矩阵进行处理,得到声音主题词袋模型;所述分类器模块对比声音主题词袋模型,对音频信号进行分类。

【技术特征摘要】
1.一种应用于异常声音检测的音频分类系统,其特征在于,包括特征提取与处理模块、潜在概率语义模型模块和分类器模块;所述特征提取与处理模块用于提取语音的音频信号特征,并构建词-频共现矩阵;所述潜在概率语义模型模块用于对词-频共现矩阵进行处理,得到声音主题词袋模型;所述分类器模块对比声音主题词袋模型,对音频信号进行分类。2.如权利要求1所述的音频分类系统,其特征在于,所述语音包括训练语音和测试语音;所述分类器模块对比训练语音和测试语音的声音主题词袋模型,对测试语音的音频信号进行分类。3.如权利要求1所述的音频分类系统,其特征在于,提取音频信号特征时选择提取12维的梅尔频率倒谱系数和12维的一阶梅尔频率倒谱系数,构建24维的特征向量矩阵。4.如权利要求1所述的音频分类系统,其特征在于,提取音频信号特征的过程包括:预加重、端点检测、分帧、加窗、快速傅里叶变换、Mel频率...

【专利技术属性】
技术研发人员:陈曙东孔聪聪辛欣
申请(专利权)人:中国科学院微电子研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1