一种异常声音分类方法、系统、装置以及存储介质制造方法及图纸

技术编号:30964065 阅读:24 留言:0更新日期:2021-11-25 20:30
本申请公开了一种异常声音分类方法、系统、装置以及存储介质,该方法包括:获取到待检测的异常音频信号的声学特征;将声学特征输入到多分类器中,利用多分类器基于声学特征确定异常音频信号与各种异常类别的似然度;响应于两个最大的似然度的差值小于设定值,利用两个最大的似然度对应的两种异常类别的二分类器对声学特征进行检测,得到异常音频信号的异常类型。通过上述方式,本申请能够极大地减小相似声音对异常音频信号的识别干扰,从而提升异常声音检测的准确率。常声音检测的准确率。常声音检测的准确率。

【技术实现步骤摘要】
一种异常声音分类方法、系统、装置以及存储介质


[0001]本申请涉及声音信号处理领域,特别是涉及一种异常声音分类方法、系统、装置以及存储介质。

技术介绍

[0002]在安防领域中,主流的监控手段是视频监控,但是视频监控由于其监测视野限制,并不能探测到盲区的事件发生情况,因此,在安防领域中采用音频事件检测的方法作为辅助,对威胁公共安全事件的检测会更为高效,将视频监控和音频监控结合的监控手段是未来的发展趋势。
[0003]目前的异常音频检测方法在获取到需要检测的音频片段后,对音频片段分帧以进行时域、频域或倒谱域的特征提取,继而将特征片段送入分类模型中,通过分类模型对特征片段进行识别以得到最终检测结果。
[0004]现有技术仅对特征片段进行简单分类,如果待检测的音频片段属于容易混淆的多种声音类型的中的一种,例如,在实际会议场景中,需要检测爆炸声、枪声、尖叫声等威胁公共安全事件,然而,由于敲击键盘声和关门声容易识别为枪声,脚步声也容易与枪声混淆,且咳嗽声与尖叫声具有一定相似性,故通过现有技术无法准确对音频片段所属的异常类别进行判定,无法提升异常声音检测的准确率。

技术实现思路

[0005]本申请主要解决的技术问题是提供一种异常声音分类方法、系统、装置以及存储介质,通过对异常音频信号进行多级分类,能够提升异常声音检测的准确率。
[0006]为解决上述技术问题,本申请采用的第一技术方案是提供一种异常声音分类方法,包括:获取到待检测的异常音频信号的声学特征;将声学特征输入到多分类器中,利用多分类器基于声学特征确定异常音频信号与各种异常类别的似然度;响应于两个最大的似然度的差值小于设定值,利用两个最大的似然度对应的两种异常类别的二分类器对声学特征进行检测,得到异常音频信号的异常类型。
[0007]其中,获取到待检测的异常音频信号的声学特征的步骤,包括:获取到待检测的异常音频信号;对异常音频信号进行多维度特征提取,得到异常音频信号的多维度的声学特征;其中,多维度的声学特征至少包括时域特征、频域特征以及倒谱域特征中的至少两种。
[0008]其中,获取到待检测的异常音频信号的声学特征的步骤,包括:获取到异常音频信号,并对异常音频信号进行分帧处理;对每一帧异常音频信号进行特征提取,得到各帧异常音频信号的声学特征;将声学特征输入到多分类器中,利用多分类器基于声学特征确定异常音频信号与各种异常类别的似然度的步骤,包括:将各帧异常音频信号的声学特征输入到多分类器中,得到各帧异常音频信号与各种异常类别的似然度;响应于两个最大的似然度的差值小于设定值,利用两个最大的似然度对应的两种异常类别的二分类器对声学特征进行检测,得到异常音频信号的异常类型的步骤,包括:响应于当前帧两个最大的似然度的
差值小于设定值,利用两个最大的似然度对应的两种异常类别的二分类器对当前帧进行检测,得到当前帧的异常类型;利用连续设定量的多帧异常音频信号的异常类型确定异常音频信号的异常类型。
[0009]其中,利用连续设定量的多帧异常音频信号的异常类型确定异常音频信号的异常类型的步骤,包括:统计属于各个异常类型的异常音频信号的帧数;将包括帧数最多的异常类型确定为异常音频信号的异常类型。
[0010]其中,对每一帧异常音频信号进行特征提取,得到各帧异常音频信号的声学特征的步骤,包括:对每一帧异常音频信号进行加窗处理;利用快速傅里叶变换将加窗处理后的时域信号变换为频域信号,再基于频域信号得到信号能量谱;利用滤波器对信号能量谱进行带通滤波,并对滤波器的输出取对数,以变换至对数能量谱域;利用离散余弦变换将对数能量谱域变换到倒谱域,得到各维相互独立的特征矢量。
[0011]其中,响应于两个最大的似然度的差值小于设定值,利用两个最大的似然度对应的两种异常类别的二分类器对声学特征进行检测,得到异常音频信号的异常类型的步骤,包括:响应于两个最大的似然度的差值小于设定值,提取两个最大的似然度分别对应的两个异常类别建立二分类器;其中,二分类器包括高斯核函数;将异常音频信号的声学特征输入到二分类器中,利用高斯核函数基于聚类的方式提取距离较远的统计特征,并基于统计特征对声学特征进行分类,得到异常音频信号的异常类型。
[0012]其中,获取到待检测的异常音频信号的声学特征的步骤前,还包括:获取音频信号,计算音频信号的短时能量;比较短时能量与设定能量阈值的大小;响应于音频信号的短时能量大于设定能量阈值,将音频信号确定为待检测的异常音频信号。
[0013]为解决上述技术问题,本申请采用的第二技术方案是提供一种异常声音分类系统,包括:特征获取模块,用于获取到待检测的异常音频信号的声学特征;第一分类模块,用于将声学特征输入到多分类器中,利用多分类器基于声学特征确定异常音频信号与各种异常类别的似然度;第二分类模块,用于响应于两个最大的似然度的差值小于设定值,利用两个最大的似然度对应的两种异常类别的二分类器对声学特征进行检测,得到异常音频信号的异常类型。
[0014]为解决上述技术问题,本申请采用的第三技术方案是提供一种异常声音分类装置,包括:存储器,用于存储程序数据,存储程序数据被执行时实现如上述任一项所述的异常声音分类方法中的步骤;处理器,用于执行存储器存储的程序指令以实现如上述任一项所述的异常声音分类方法中的步骤。
[0015]为解决上述技术问题,本申请采用的第四技术方案是提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述任一项所述的异常声音分类方法中的步骤。
[0016]本申请的有益效果是:区别于现有技术,本申请提供一种异常声音分类方法、系统、装置以及存储介质,通过将获取到的待检测的异常音频信号的声学特征输入到多分类器中进行初步检测,能够预测出异常音频信号的大致异常类型,再基于初步检测的结果建立更具有针对性的二分类器,并将声学特征输入到二分类器中进行分类,能够极大地减小相似声音对异常音频信号的识别干扰,从而提升异常声音检测的准确率。
附图说明
[0017]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1是本申请异常声音分类方法一实施方式的流程示意图;
[0019]图2是本申请获取待检测的异常音频信号的方法一实施方式的流程示意图;
[0020]图3是本申请提取声学特征一具体实施方式的流程示意图;
[0021]图4是图3中步骤S32一具体实施方式的流程示意图;
[0022]图5是图1中步骤S13一具体实施方式的流程示意图;
[0023]图6是本申请异常声音分类系统一实施方式的结构示意图;
[0024]图7是本申请异常声音分类装置一实施方式的结构示意图;
[0025]图8是本申请计算机可读存储本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常声音分类方法,其特征在于,包括:获取到待检测的异常音频信号的声学特征;将所述声学特征输入到多分类器中,利用所述多分类器基于所述声学特征确定所述异常音频信号与各种异常类别的似然度;响应于两个最大的似然度的差值小于设定值,利用所述两个最大的似然度对应的两种异常类别的二分类器对所述声学特征进行检测,得到所述异常音频信号的异常类型。2.根据权利要求1所述的异常声音分类方法,其特征在于,所述获取到待检测的异常音频信号的声学特征的步骤,包括:获取到所述待检测的异常音频信号;对所述异常音频信号进行多维度特征提取,得到所述异常音频信号的多维度的所述声学特征;其中,所述多维度的所述声学特征至少包括时域特征、频域特征以及倒谱域特征中的至少两种。3.根据权利要求1或2所述的异常声音分类方法,其特征在于,所述获取到待检测的异常音频信号的声学特征的步骤,包括:获取到所述异常音频信号,并对所述异常音频信号进行分帧处理;对每一帧异常音频信号进行特征提取,得到各帧异常音频信号的声学特征;所述将所述声学特征输入到多分类器中,利用所述多分类器基于所述声学特征确定所述异常音频信号与各种异常类别的似然度的步骤,包括:将所述各帧异常音频信号的声学特征输入到所述多分类器中,得到所述各帧异常音频信号与所述各种异常类别的似然度;所述响应于两个最大的似然度的差值小于设定值,利用所述两个最大的似然度对应的两种异常类别的二分类器对所述声学特征进行检测,得到所述异常音频信号的异常类型的步骤,包括:响应于当前帧两个最大的似然度的差值小于设定值,利用所述两个最大的似然度对应的两种异常类别的二分类器对所述当前帧进行检测,得到所述当前帧的异常类型;利用连续设定量的多帧异常音频信号的异常类型确定所述异常音频信号的异常类型。4.根据权利要求3所述的异常声音分类方法,其特征在于,所述利用连续设定量的多帧异常音频信号的异常类型确定所述异常音频信号的异常类型的步骤,包括:统计属于各个异常类型的异常音频信号的帧数;将包括帧数最多的异常类型确定为所述异常音频信号的异常类型。5.根据权利要求3所述的异常声音分类方法,其特征在于,所述对每一帧异常音频信号进行特征提取,得到各帧异常音频信号的声学特征的步骤,包括:对所述每一帧异常音频信号进行加窗处理;利用快速傅里叶...

【专利技术属性】
技术研发人员:王宝俊张锦铖史巍林聚财殷俊
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1