声音检测方法、装置及计算机可读存储介质制造方法及图纸

技术编号:33437701 阅读:31 留言:0更新日期:2022-05-19 00:25
本申请公开了一种声音检测方法、装置及计算机可读存储介质,该方法包括:对待检测声音信号进行分段检测,得到每段子声音信号的检测结果,其中,每段子声音信号的检测结果包括子声音信号中发生各个预设声音事件的概率;基于每段子声音信号的检测结果,确定待检测声音信号中发生的声音事件。本申请所提供的方法能够提高声音检测的准确率。提高声音检测的准确率。提高声音检测的准确率。

【技术实现步骤摘要】
声音检测方法、装置及计算机可读存储介质


[0001]本申请涉及声音检测
,特别是涉及一种声音检测方法、装置及计算机可读存储介质。

技术介绍

[0002]在监控布满大街小巷,图像检测愈发准确的今天,机器已具备了通过监控摄像头传来的图像信息来对图像中发生的事件进行检测的能力。然而,在某些监控无法探及的角落里,依旧发生着危害人民健康、损害人民财产的事件,由此声音检测应运而生。现阶段声音检测虽然得到了大力发展,但是准确率还有待进一步提高。

技术实现思路

[0003]本申请提供一种声音检测方法、装置及计算机可读存储介质,能够提高声音检测的准确率。
[0004]本申请实施例第一方面提供一种声音检测方法,所述方法包括:对待检测声音信号进行分段检测,得到每段子声音信号的检测结果,其中,每段子声音信号的检测结果包括所述子声音信号中发生各个预设声音事件的概率;基于每段所述子声音信号的检测结果,确定所述待检测声音信号中发生的声音事件。
[0005]本申请实施例第二方面提供一种声音检测装置,所述声音检测装置包括处理器、存储器以及通本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声音检测方法,其特征在于,所述方法包括:对待检测声音信号进行分段检测,得到每段子声音信号的检测结果,其中,每段子声音信号的检测结果包括所述子声音信号中发生各个预设声音事件的概率;基于每段所述子声音信号的检测结果,确定所述待检测声音信号中发生的声音事件。2.根据权利要求1所述的方法,其特征在于,所述对待检测声音信号进行分段检测,得到每段子声音信号的检测结果的步骤,包括:对每段所述子声音信号进行如下处理:提取所述子声音信号的声音特征;将所述子声音信号的声音特征送入预先训练好的检测网络,得到所述子声音信号的所述检测结果。3.根据权利要求2所述的方法,其特征在于,所述提取所述子声音信号的声音特征的步骤,包括:提取所述子声音信号中每帧声音信号的声音特征;将所述每帧声音信号的声音特征进行拼接,得到所述子声音信号的声音特征。4.根据权利要求2所述的方法,其特征在于,在所述对待检测声音信号进行分段检测,得到每段子声音信号的检测结果之前,还包括:获取训练数据集,所述训练数据集包括发生各个所述预设声音事件的多个声音信号;利用所述训练数据集,对所述检测网络进行训练,得到所述训练后的检测网络。5.根据权利要求4所述的方法,其特征在于,所述利用所述训练数据集,对所述检测网络进行训练,得到所述训练后的检测网络的步骤,包括:基于目标场景关联的参考音频,对所述训练数据集中的声音信号进行干扰处理,以使所述声音信号的分布特征与所述目标场景相符;利用进行所述干扰处理后的所述训练数据集对所述检测网络进行训练。6.根据权利要求5所述的方法,其特征在于,所述基于目标场景关联的参考音频,对所述训练数据集中的声音信号进行干扰处理的步骤,包括:所述参考音频包括所述目标场景关联的冲激响应,利用所述目标场景关联的冲激响应和所述声音信号进行卷积处理;和/或所述参考音频包括所述目标场景关联的噪声,利用所述噪声与所述声音信号进行叠加处理。7.根据权利要求4所述的方法,其特征在于,所述预设声音事件包括N个;所述N为大于1的整数;所述训练数据集至少包括N个训练数据子集;一个所述训练数据子集中的声音信号发生N个预设声音事件中的一个预设声音事件,不同训练数据子集中的声音信号发生的预设声音事件不同;N个训练数据子集中声音信号的数量的最大值与最小值的比值小于或者等于第一阈值。8.根据权利要求7所述的方法,其特征在于,在所述利用所述训练数据集,对所述检测网络进行训练之前,还包括:确定所述N个训练数据子集中声音信号的数量的最大值;
响应于所述N个训练数据子集中存在声音信号的数量与所述最大值的比值小于第二阈值的目标训练数据子集,对所述目标训练数据子集中的声音信号进行数据扩展处理,至所述目标训练数据子集中声音信号的数量与所述最大值的比值等于或大于第二阈值,所述第二阈值与所述第一阈值的乘积为1。9.根据权利要求8所述的方法,其特征在于,所述对所述目标训练数据子集中的声音信号进行数据扩展处理的步骤,包括:对所述目标训练数据子集中的声音信号进行移频处理,得到新声音信号,并在所述目标训练数据子集中增加所述新声音信号;或者,采用生成对抗网络生成所述目标训练数据子集中的声音信号的相似声音信号,并在所述目标训...

【专利技术属性】
技术研发人员:吴人杰王宝俊林聚财殷俊
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1