异常音识别方法、装置及计算机存储介质制造方法及图纸

技术编号:25693263 阅读:23 留言:0更新日期:2020-09-18 21:04
本申请公开了一种异常音识别方法、装置及计算机存储介质,该异常音识别方法包括:获取待测音频数据;将待测音频数据转换为待测音频特征序列;对多个标准模板特征序列进行筛选而保留与待测音频特征序列相似的部分标准模板特征序列;利用形状动态时间规整算法分别计算待测音频特征序列与保留的部分标准模板特征序列之间的相似度;根据待测音频特征序列与保留的部分标准模板特征序列之间的相似度而确定与待测音频特征序列最相似的标准模板特征序列;根据最相似的标准模板特征序列确定待测音频数据中异常音的类别。本申请所提供的异常音识别方法能够快速、准确地识别异常音。

【技术实现步骤摘要】
异常音识别方法、装置及计算机存储介质
本申请涉及异常音检测领域,特别是涉及一种异常音识别方法、装置及计算机存储介质。
技术介绍
目前的安防监控的解决方案主要以视频为核心,实现对大场景、动态场所的异常状况的监控和报警,但是视频监控在异常天气或者复杂场合下存在短板,同时视频解决方案对硬件性能要求较高,针对这种情况,现在越来越多的安防领域采用音视频结合的手段,综合两者信息提高监控系统的智能化程度。当采用音视频结合的手段进行监控时,需要对异常音进行识别,而安防领域的异常音包括爆炸声、枪声、呼救声、玻璃碎裂声音等,针对异常音的识别技术由语音识别技术发展而来,本申请的专利技术人发现目前进行异常音识别的速度和准确率还有待提高。
技术实现思路
本申请主要解决的技术问题是提供一种异常音识别方法、装置及计算机存储介质,能够快速、准确地识别异常音。为解决上述技术问题,本申请采用的一个技术方案是:提供一种异常音识别方法,所述方法包括:获取待测音频数据;将所述待测音频数据转换为待测音频特征序列;对多个标准模板特征序列进行筛选而保留与所述待测音频特征序列相似的部分所述标准模板特征序列;利用形状动态时间规整算法分别计算所述待测音频特征序列与保留的部分所述标准模板特征序列之间的相似度;根据所述待测音频特征序列与保留的部分所述标准模板特征序列之间的相似度而确定与所述待测音频特征序列最相似的标准模板特征序列;根据所述最相似的标准模板特征序列确定所述待测音频数据中异常音的类别。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种异常音识别装置,包括处理器、存储器以及通信电路,所述处理器分别耦接所述存储器、所述通信电路,所述存储器中存储有程序数据,所述处理器通过执行所述存储器内的所述程序数据以实现上述方法中的步骤。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种计算机存储介质,所述计算机存储介质存储有程序数据,所述程序数据能够被处理器执行以实现上述方法中的步骤。本申请的有益效果是:本申请异常音识别方法一方面先对多个标准模板特征序列进行筛选,只保留与待测音频特征序列相似的部分标准模板特征序列,另一方面利用形状动态时间规整算法分别计算待测音频特征序列与保留的部分标准模板特征序列之间的相似度,从而确定与待测音频特征序列最相似的标准模板特征序列,能够节省计算时间,加快计算速度,以及提高待测音频特征序列与标准模板特征序列之间相似度计算的准确率,间接提高异常音识别的准确率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:图1是本申请异常音识别方法一实施方式的流程示意图;图2是图1中步骤S120的流程示意图;图3是图1中步骤S130在一应用场景中的流程示意图;图4是在对待测音频特征序列和标准模板特征序列进行分割时的示意图;图5是图1中步骤S130在另一应用场景中的流程示意图;图6是待测音频特征序列和标准模板特征序列的相对位置示意图;图7是本申请异常音识别装置一实施方式的结构示意图;图8是本申请异常音识别装置另一实施方式的结构示意图;图9是本申请计算机存储介质一实施方式的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。参阅图1,图1是本申请异常音识别方法一实施方式的流程示意图。该异常音识别方法包括:S110:获取待测音频数据。通过声音采集设备获取到待测音频数据。S120:将待测音频数据转换为待测音频特征序列。对待测音频数据在时间上进行离散化处理而得到待测音频特征序列。在一应用场景中,如图2所示,步骤S120具体包括:S121:将待测音频数据进行交叠分帧处理,以得到多个声音帧。对待测音频数据进行分帧实质上是对待测音频数据进行短时分析,短时分析就是把声音信号分成具有固定周期的时间短段,每个时间短段是相对固定的持续时间片段。对待测音频数据进行交叠分帧处理就是得到的相邻声音帧之间部分重叠,其中重叠情况可以根据实际情况进行选择,例如在一应用场景中,为了减少能量泄露以及保证音频数据信息的完整性,相邻两帧重叠的部分为帧长的1/3。S122:计算多个声音帧各自对应的特征矢量。声音帧对应的特征矢量用于表征声音帧的特征信息。其中,声音帧对应的特征矢量可以是梅尔倒谱系数(MFCC)、线性预测系数(LPC)等。在一具体实例中,步骤S122具体包括:计算多个声音帧各自对应的梅尔倒谱系数(MFCC)。具体地,依次对多个声音帧进行加窗处理、FFT变换(快速傅里叶变换)、MEL滤波处理(三角滤波处理)、LOG变换(对数变换)、DCT变换(离散余弦变换)等步骤而得到多个声音帧各自对应的梅尔倒谱系数,其中,梅尔倒谱系数的计算过程属于现有技术,在此不做具体介绍。S123:将多个声音帧各自对应的特征矢量按照多个声音帧的先后顺序进行排序而组成待测音频特征序列。S130:对多个标准模板特征序列进行筛选而保留与待测音频特征序列相似的部分标准模板特征序列。其中,每个标准模板特征序列各自对应一种异常音,例如,有的标准模板特征序列对应枪声,有的标准模板序列对应爆炸声,而有的标准模板特征序列对应呼叫声。具体地,先粗略估计待测音频特征序列和一标准模板特征序列之间是否相似,若粗略判定待测音频特征序列和该标准模板特征序列不相似,则直接判定待测音频特征序列对应的异常音与标准模板特征序列对应的异常音不同,直接将该标准模板特征序列舍弃,后续不再计算待测音频特征序列与该标准模板特征序列之间的相似度;若粗略判定待测音频特征序列和该标准模板特征序列相似,则保留该标准模板特征序列,后续再通过精确计算待测音频特征序列与该标准模板特征序列之间的相似度而判断待测音频特征序列对应的异常音与该标准模板特征序列对应的异常音是否相同。最终通过步骤S130可以筛选掉一部分与待测音频特征序列不相似的标准模板特征序列,可以减少后续的计算量,提高整个运行速度。S140:利用形状动态时间规整算法分别计算待测音频特征序列与保留的部分标准模板特征序列之间的相似度。形状动态时间规整算法shapeDTW是在传统的动态时间规整算法DTW上进行改进的算法。具体地,传统的动态时间规整算法DTW(DynamicTimeWarping)基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典本文档来自技高网...

【技术保护点】
1.一种异常音识别方法,其特征在于,所述方法包括:/n获取待测音频数据;/n将所述待测音频数据转换为待测音频特征序列;/n对多个标准模板特征序列进行筛选而保留与所述待测音频特征序列相似的部分所述标准模板特征序列;/n利用形状动态时间规整算法分别计算所述待测音频特征序列与保留的部分所述标准模板特征序列之间的相似度;/n根据所述待测音频特征序列与保留的部分所述标准模板特征序列之间的相似度而确定与所述待测音频特征序列最相似的标准模板特征序列;/n根据所述最相似的标准模板特征序列确定所述待测音频数据中异常音的类别。/n

【技术特征摘要】
1.一种异常音识别方法,其特征在于,所述方法包括:
获取待测音频数据;
将所述待测音频数据转换为待测音频特征序列;
对多个标准模板特征序列进行筛选而保留与所述待测音频特征序列相似的部分所述标准模板特征序列;
利用形状动态时间规整算法分别计算所述待测音频特征序列与保留的部分所述标准模板特征序列之间的相似度;
根据所述待测音频特征序列与保留的部分所述标准模板特征序列之间的相似度而确定与所述待测音频特征序列最相似的标准模板特征序列;
根据所述最相似的标准模板特征序列确定所述待测音频数据中异常音的类别。


2.根据权利要求1所述的方法,其特征在于,所述对多个标准模板特征序列进行筛选而保留与所述待测音频特征序列相似的部分所述标准模板特征序列的步骤,包括:
确定一所述标准模板特征序列;
将所述待测音频特征序列分割成自左向右依次排列的待测音频第一子特征序列和待测音频第二子特征序列;
将确定的所述标准模板特征序列分割成自左向右依次排列的标准模板第一子特征序列和标准模板第二子特征序列,其中,所述待测音频第一子特征序列和所述标准模板第一子特征序列的长度相等;
利用动态时间规整算法计算所述待测音频第一子特征序列和所述标准模板第一子特征序列之间的第一距离值,以及利用LB_Keogh算法计算所述待测音频第二子特征序列和所述标准模板第二子特征序列之间的第二距离值,而后将所述第一距离值和所述第二距离值相加而得到第三距离值;
判断是否存在最短距离值;
若不存在,则将所述第三距离值保存为所述最短距离值,并保留确定的所述标准模板特征序列;
若存在,则判断所述第三距离值是否小于所述最短距离值;
若所述第三距离值小于所述最短距离值,则利用所述第三距离值替代所述最短距离值,并保留确定的所述标准模板特征序列,否则则舍弃确定的所述标准模板特征序列;
返回执行所述确定一所述标准模板特征序列的步骤,直至遍历所有的所述标准模板特征序列。


3.根据权利要求1所述的方法,其特征在于,所述对多个标准模板特征序列进行筛选而保留与所述待测音频特征序列相似的部分所述标准模板特征序列的步骤,包括:
确定一所述标准模板特征序列;
计算所述待测音频特征序列与确定的所述标准模板特征序列各自起点之间的第一距离值、各自终点之间的第二距离值、各自最高点之间的第三距离值以及各自最低点之间的第四距离值;
查询所述第一距离值、所述第二距离值、所述第...

【专利技术属性】
技术研发人员:张锦铖林聚财殷俊
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1