一种用于嵌入式系统的异常声音监控方法和监控装置制造方法及图纸

技术编号:8907885 阅读:196 留言:0更新日期:2013-07-12 00:40
本发明专利技术公开了一种用于嵌入式系统的异常声音监控方法和监控装置,其中监控方法,包括以下步骤:(1)获取音频数据,采用汉明窗对该音频数据进行分帧,计算每帧声音的短时幅度和短时过动态门限率,依据每帧声音的短时幅度和短时过动态门限率判断得到有效声音段;(2)利用不同种类的多个声音样本,建立音频特征模板库,其中,同一种类的声音样本对应音频特征模板库中的一个模板;(3)提取步骤(1)中得到的有效声音段的音频特征参数,并将该音频特征参数与音频特征模板库中的模板进行匹配,确定有效声音段的类别。本发明专利技术能够实现音频信号的实时采样分析,能够有效地识别监控场所内的异常声音,识别速度快,而且监控装置结构简单,可靠性强。

【技术实现步骤摘要】

本专利技术涉及电子设备领域,具体涉及一种用于嵌入式系统的异常声音监控方法和监控装置
技术介绍
随着视频监控需求的迅速增长、监控规模的日益扩大,人工监视已远远不能满足监控要求,视频监控系统的“智能化”变得越来越迫切。目前,智能监控主要基于视频信号,通过对摄像机拍录的图像序列进行自动分析,实现对动态场景中异常状况的实时监控,但是视频分析存在计算量大,实现复杂,对系统性能要求较高的特点。在某些监控场所内,音频信号往往包含了比视频信号更直接的线索,除了正常的环境声音外,还有一类声音能够有效的揭不异常状态和突发事故,称之为异常声音,监控场所内典型的异常声音包括枪声、爆炸声和玻璃破碎声等。通过对音频信号的自动分析同样可以完成对异常状况的实时监控,并且相比于视频监控系统,基于声音识别的音频监控系统具备更低的复杂度和更高的计算效率,更容易在嵌入式系统中实现。授权公告号为CN 101494049 B的专利技术公开了一种用于音频监控系统中的音频特征参数的提取方法,操作步骤如下:(I)按照设定的短时间的时长对音频采样信号序列进行分帧而将其划分为音频数据帧序列;(2)分别对该音频数据帧序列中的每个音频数据帧实时提取该帧的短时能量、短时过零率和短时信息熵;(3)对音频数据帧序列进行分段而将其划分为音频短段序列;并在上述参数基础上,提取综合每个音频短段内的所有音频数据帧的时域和频域特征、并充分考虑其前后两个时刻之间音频差异的特征参数:音频短段时频差,用于音频监控系统。基于嵌入式系统自身的特性,声音识别的算法不能过于复杂,同时要求声音识别准确率要高,在某一特定的监控场所内,异常声音的种类可以预先进行预测,可以据此设定计算复杂程度相对较低,并且能够达到快速准确进行声音识别的目的。
技术实现思路
本专利技术提供了一种用于嵌入式系统的异常声音监控方法和监控装置,能够实现音频信号的实时采样分析,能够有效地识别监控场所内的异常声音,识别速度快,而且监控装置结构简单,可靠性强。一种用于嵌入式系统的异常声音监控方法,包括以下步骤:(I)获取音频数据,采用汉明窗对该音频数据进行分帧,计算每帧声音的短时幅度和短时过动态门限率,依据每帧声音的短时幅度和短时过动态门限率判断得到有效声音段。动态门限反应了背景噪声的平均幅度水平,短时过动态门限率相较于短时过零率,能有效的减少背景噪声的影响。有效声音段的长度过长或者过短,可以丢弃,长度的判断可以根据需要进行设定。依据每帧声音的短时幅度和短时过动态门限率判断得到有效声音段的操作如下:若连续两帧的短时幅度和短时过动态门限率都大于相应阈值,则将连续两帧的结束时刻记为声音的起始点;若连续两帧的短时幅度和短时过动态门限率都不大于相应阈值,则将连续两帧的结束时刻记为声音的截止点。(2)利用不同种类的多个声音样本,建立音频特征模板库,其中,同一种类的声音样本对应音频特征模板库中的一个模板。利用不同种类的多个声音样本,建立音频特征模板库时,计算某一种类声音相对应的模板的具体操作如下:2-1、提取该种类声音中每个声音样本的音频特征参数,得到音频特征参数序列;2-2、计算所有声音样本的音频特征参数序列的平均长度,选择与平均长度相差最小的声音样本作为临时模板;2-3、对临时模板之外的其余声音样本进行动态时间弯折规整,得到音频特征参数序列长度都相等的声音样本;2-4、计算规整后的声音样本的音频特征参数的平均值,该平均值即为音频特征模板库中的模板。建立音频特征模板库时可以使用声音样本库中的声音,也可以自行模拟,针对监控空间的特点选择可能出现的若干种异常声音进行相应模板的建立。所述音频特征参数包括短时幅度、12阶MFCC和12阶MFCC的一阶差分系数。短时幅度表征一帧声音音频能量的大小,是音频信号一个重要的时域特征,并且计算时无需求平方运算,有利于减轻计算量。MFCC是将人耳听觉感知特性和声音的产生相结合的一种特征参数,12阶MFCC(Mel频率倒谱系数)考虑了人耳听觉的非线性特性,具有良好的识别性能和抗噪能力。12阶MFCC的一阶差分系数反映了音频中帧与帧之间存在的关联,是表示音频特征参数随时间变化的规律,有助于区分不同的声音信号。建立音频特征模板库时提取的音频特征参数与采集的实时监控的声音中所提取的音频特征参数的种类一样。(3)提取步骤(I)中得到的有效声音段的音频特征参数,并将该音频特征参数与音频特征模板库中的模板进行匹配,确定有效声音段的类别。将该音频特征参数与音频特征模板库中的模板进行匹配时的具体操作如下:3-1、计算有效声音段中每一帧声音与音频特征模板库中的每个模板的匹配距离,得到匹配距离的最小值Dmin;3-2、定义距离门限TH,当Dmin/N ( TH时,有效声音段与Dmin对应的模板匹配,当Dmin/N>TH时,有效声音段与音频特征模板库中的任一模板都不匹配,N为有效声音段中的声音帧数。作为优选,还包括步骤(4),依据有效声音段的类别进行报警。音频特征模板库中的一个模板对应一种异常声音,若有效声音段的音频特征参数与音频特征模板库中的模板相匹配,则判定该有效声音段为异常声音,若为异常声音,则进行报警,通知有关人员及时处理,也可以通过千兆以太网接口上报报警信息到中心服务器。本专利技术着重关注某一监控场所内的能够揭示异常状况和突发事故的异常声音,该监控场所内的有限种异常声音可以预先进行判断,例如一个房间里出现暴炸省、玻璃破碎声或者枪声等,预先为每一种异常声音建立相应的模板,存储在音频特征模板库中,出现异常声音时,只需要与音频特征模板库中的模板进行匹配即可进行识别。本专利技术还提供了一种用于嵌入式系统的异常声音监控装置,包括以下单元:音频接收单元,用于获取音频数据;有效声音段端点检测单元,用于采用汉明窗对音频数据进行分帧,计算每帧声音的短时幅度和短时过动态门限率,依据每帧声音的短时幅度和短时过动态门限率判断得到有效声音段;音频特征模板库建立单元,用于利用不同种类的多个声音样本,建立音频特征模板库;音频特征提取单元,用于提取有效声音段的音频特征参数;有效声音段识别单元,用于将音频特征参数与音频特征模板库中的模板进行匹配,确定有效声音段的类别;异常报警单元,用于依据有效声音段的类别进行报警。本专利技术提供了一种用于嵌入式系统的异常声音监控方法和监控装置,方法简单,能够适应某一特定监控空间内音频信号的实时采样分析,快速地识别监控场所内的异常声音,监控装置结构简单,可靠性强。附图说明图1为本专利技术用于嵌入式系统的异常声音监控装置的示意图2为本专利技术用于嵌入式系统的异常声音监控装置的结构示意图3为本专利技术用于嵌入式系统的异常声音监控方法的流程图4为本专利技术用于嵌入式系统的异常声音监控方法中主进程的流程图。图5为本专利技术用于嵌入式系统的异常声音监控方法中线程的流程图。具体实施方式下面结合附图,对本专利技术一种用于嵌入式系统的异常声音监控方法和监控装置做详细描述。如图3所示,一种用于嵌入式系统的异常声音监控方法,包括以下步骤:(I)获取音频数据,采用汉明窗对该音频数据进行分帧,计算每帧声音的短时幅度和短时过动态门限率,依据每帧声音的短时幅度和短时过动态门限率判断得到有效声音段。使用汉明窗进行分巾贞时,窗长取256,以16ms(256个米样点)为一巾贞,巾贞本文档来自技高网
...

【技术保护点】
一种用于嵌入式系统的异常声音监控方法,其特征在于,包括以下步骤:(1)获取音频数据,采用汉明窗对该音频数据进行分帧,计算每帧声音的短时幅度和短时过动态门限率,依据每帧声音的短时幅度和短时过动态门限率判断得到有效声音段;(2)利用不同种类的多个声音样本,建立音频特征模板库,其中,同一种类的声音样本对应音频特征模板库中的一个模板;(3)提取步骤(1)中得到的有效声音段的音频特征参数,并将该音频特征参数与音频特征模板库中的模板进行匹配,确定有效声音段的类别。

【技术特征摘要】

【专利技术属性】
技术研发人员:吕杰
申请(专利权)人:苏州皓泰视频技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利