麦克风阵列的检测方法、装置、设备以及存储介质制造方法及图纸

技术编号:25921895 阅读:49 留言:0更新日期:2020-10-13 10:42
本申请提供一种麦克风阵列的检测方法、装置、设备以及存储介质。该方法通过根据麦克风阵列采集的音频信号的音频特征,确定所述音频信号是否包含违规声音信号,并在所述音频信号包含违规声音信号时,对音频信号进行特征提取,得到每帧音频信号的时频特征,时频特征用于指示该路音频信号的频域幅度特征和时域能量特征,并将每帧音频信号的时频特征输入到预训练得到的麦克风异常检测模型,得到麦克风阵列中各麦克风是否异常的检测结果,提高对用于采集违规声音的麦克风阵列检测的准确性。

【技术实现步骤摘要】
麦克风阵列的检测方法、装置、设备以及存储介质
本申请涉及音频设备检测
,尤其涉及一种麦克风阵列的检测方法、装置、设备以及存储介质。
技术介绍
随着监控设备的不断发展,监控设备应用于多个领域之中,不仅能够提供视频图像的监控也能提供音频的监控。用于音频监控的监控设备一般都采用麦克风阵列进行音频数据的采集,在实际应用场景中,以应用于路网的违规声音抓拍为例,麦克风阵列在使用过程中,受室外的风雨、尘土、电磁干扰等因素的影响,容易导致部分麦克风不能正常采集声音,从而使麦克风阵列对违规声音抓拍的性能急剧下降,因此需要对麦克风阵列的状态进行检测,以确保麦克风阵列中的麦克风均可以正常工作。现有技术中,对于麦克风阵列的检测是通过计算各路音频信号的特征差异值,在特征差异值大于预设阈值时,确定该路音频信号对应的麦克风异常。然而,现有技术中所提供麦克风阵列一般用于检测采集近距离声音的麦克风阵列,例如手机中的麦克风阵列,当麦克风阵列需要采集较远距离的声音或者周围环境中声音较为复杂时,仅通过特征差异值的大小确定麦克风阵列的状态,容易造成误检,导致检测的准确性较差。
技术实现思路
本申请提供一种麦克风阵列的检测方法、装置、设备以及存储介质,能够针对应用于复杂环境的麦克风阵列进行检测,提高了检测的准确性。第一方面,本申请实施例提供一种麦克风阵列的检测方法,包括:根据麦克风阵列采集的音频信号的音频特征,确定所述音频信号是否包含违规声音信号;在所述音频信号包含违规声音信号时,对所述音频信号进行特征提取,得到每帧音频信号的时频特征,所述时频特征用于指示所述音频信号的频域幅度特征和时域能量特征;将每帧音频信号的时频特征输入到预训练得到的麦克风异常检测模型,得到所述麦克风阵列中各麦克风是否异常的检测结果。第二方面,本申请实施例提供的一种麦克风阵列的检测装置,所述装置包括:第一处理模块,用于根据麦克风阵列采集的音频信号的音频特征,确定所述音频信号是否包含违规声音信号;第二处理模块,用于在所述音频信号包含违规声音信号时,对所述音频信号进行特征提取,得到每帧音频信号的时频特征,所述时频特征用于指示所述音频信号的频域幅度特征和时域能量特征;第三处理模块,用于将每帧音频信号的时频特征输入到预训练得到的麦克风异常检测模型,得到所述麦克风阵列中各麦克风是否异常的检测结果。第三方面,本申请实施例提供的一种监控设备,包括:麦克风阵列、存储器和处理器;所述麦克风阵列采集目标区域内的音频信号;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如第一方面任一项所述的麦克风阵列的检测方法。第四方面,本申请实施例提供的一种服务器,包括:存储器和处理器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如第一方面任一项所述的麦克风阵列的检测方法。本申请实施例,通过在麦克风阵列采集的多路音频信号中包含违规声音信号时对麦克风阵列进行检测,并且对每个麦克风采集的音频信号进行特征提取时,同时提取频域幅度特征和时域能量特征,多种时频特征能够尽可能全面的反映音频信号的特征,并利用预先经过大量样本训练得到的麦克风异常检测模型对各个麦克风的状态进行检测,实现了在麦克风阵列采集违规声音的场景下,提高对麦克风阵列的检测的准确性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种应用场景示意图;图2为本申请实施例提供的一种麦克风阵列的检测方法的流程示意图;图3为本申请实施例提供的一种音频信号的幅度谱数据示意图;图4为本申请实施例提供的一种音频信号的二值化幅度谱示意图;图5为本申请实施例提供的一种麦克风异常检测模型训练的流程示意图;图6为本申请实施例提供的一种麦克风阵列的检测方法的流程示意图;图7为本申请实施例提供的一种麦克风阵列的检测方法的流程示意图;图8为本申请实施例提供的一种特征提取过程的示意图;图9为本申请实施例提供的一种违规声音信号识别的流程示意图;图10为本申请实施例提供的一种违规声音信号识别模型训练的流程示意图;图11为本申请实施例提供的一种优化违规声音信号识别模型的流程示意图;图12为本申请实施例提供的一种麦克风阵列的检测方法的流程示意图;图13为本申请实施例提供的一种确定信号拾音有效性的流程示意图;图14为本申请实施例提供的一种麦克风阵列的检测装置的结构示意图;图15为本申请实施例提供的另一种麦克风阵列的检测装置的结构示意图;图16为本申请实施例提供的另一种麦克风阵列的检测装置的结构示意图;图17为本申请一实施例提供的监控设备的硬件结构示意图;图18为本申请一实施例提供的服务器的硬件结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。首先,对本申请实施例应用的场景进行简单说明。以网络摄像机(IPCamera,IPC)为例的监控设备通过所设置的麦克风阵列对目标区域内的音频信号进行采集,在音频信号中包含违规声音时进行记录,例如对目标区域进行图像抓拍,实现对目标区域的音频监控,应理解,在对不同的目标区域进行监控时,违规声音的定义不同,例如,在目标区域为某一交通路段时,违规声音可以包括鸣笛声或超过预设分贝的引擎声(如炸街车声)等,在目标区域为考场时,违规声音可以包括超过预设分贝的人声。现有技术在麦克风阵列采集违规声音的场景下,对麦克风阵列进行检测是通过播放用于测试麦克风阵列的源音频,再通过麦克风阵列基于源音频采集测试音频,通过比较源音频和测试音频判断麦克风阵列中的麦克风是否为异常麦克风,因此,现有技术对于麦克风阵列的检测需要通过播放专门用于测试的源音频来实现,降低了检测的便利性。为了能够在麦克风阵列使用的过程中对麦克风阵列进行实时的、准确的检测,本申请实施例在麦克风阵列对目标区域中的违规声音进行采集的时候,针对麦克风阵列获取的包含违规声音信号的音频信号对麦克风的状态进行实时的检测,提高了在监控违规声音的场景下对麦克风检测的准确性。本申请实施例可应用于对上述麦克风阵列的检测场景中,通过以下几个实施例进行具体说明。图1为本申请实施例提供的一种应用场景示意图,本文档来自技高网...

【技术保护点】
1.一种麦克风阵列的检测方法,其特征在于,包括:/n根据麦克风阵列采集的音频信号的音频特征,确定所述音频信号是否包含违规声音信号;/n在所述音频信号包含违规声音信号时,对所述音频信号进行特征提取,得到每帧音频信号的时频特征,所述时频特征用于指示所述音频信号的频域幅度特征和时域能量特征;/n将每帧音频信号的时频特征输入到预训练得到的麦克风异常检测模型,得到所述麦克风阵列中各麦克风是否异常的检测结果。/n

【技术特征摘要】
1.一种麦克风阵列的检测方法,其特征在于,包括:
根据麦克风阵列采集的音频信号的音频特征,确定所述音频信号是否包含违规声音信号;
在所述音频信号包含违规声音信号时,对所述音频信号进行特征提取,得到每帧音频信号的时频特征,所述时频特征用于指示所述音频信号的频域幅度特征和时域能量特征;
将每帧音频信号的时频特征输入到预训练得到的麦克风异常检测模型,得到所述麦克风阵列中各麦克风是否异常的检测结果。


2.根据权利要求1所述的方法,其特征在于,所述对所述音频信号进行特征提取,得到每帧音频信号的时频特征,包括:
通过傅里叶变换,将所述音频信号转换为频域信号,得到所述音频信号的幅度谱;所述幅度谱包括与所述音频信号对应的频域信号在K个频率点上的幅度;所述K为大于等于1的正整数;
对所述音频信号的幅度谱进行二值化处理;
将二值化处理后的幅度谱中的各个元素进行组合,得到所述音频信号的频域幅度特征。


3.根据权利要求2所述的方法,其特征在于,对所述音频信号的幅度谱进行二值化处理,包括:
确定所述音频信号的幅度谱中出现的所有幅度的平均值;
比较所述音频信号中第一幅度与所述平均值;所述第一幅度为所述音频信号的幅度谱中的任一幅度;
若所述第一幅度大于所述平均值,则将所述第一幅度设置为第一数值;
若所述第一幅度小于或等于所述平均值,则将所述第一幅度设置为第二数值。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述将每帧音频信号的时频特征输入到预训练得到的麦克风异常检测模型之前,还包括:
根据采集的多个包含违规声音信号的音频训练信号,得到多个训练样本;所述训练样本包括每个音频训练信号的所述时频特征和状态标签;所述状态标签用于标注所述音频训练信号对应的麦克风的状态为正常或者异常;
将所述多个训练样本输入到初始网络模型中进行迭代训练,得到所述麦克风异常检测模型。


5.根据权利要求1至3任一项所述的方法,其特征在于,所述根据麦克风阵列采集的音频信号的音频特征,确定所述音频信号是否包含违规声音信号,包括:
从所述麦克风阵列采集的所述音频信号中,选择音频能量最大的一路音频信号作为待检测信号;
采用分帧加窗处理,将所述待检测信号划分为多个信号段;
根据所述多个信号段,提取所述待检测信号的音频特征;
将所述音频特征输入到预先训练的违规声音信号识别模型,得到所述待检测信号中是否包含违规声音信号的识别结果。


6.根据权利要求5所述的方法,其特征在于,所述将所述音频特征输入到预先训练的违规声音信号识别模型之前,还包括:
采用分帧加窗处理,将预先采集的样本集合中的每个样本划分为多个信号段,其中,每个样本设置有对应的状态标签,所述状态标签用于标注所述样本是否包含违规声音;
针对每个样本划分得到的每个信号段,提...

【专利技术属性】
技术研发人员:陈扬坤
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1