音频事件检测方法、装置、电子设备、存储介质及产品制造方法及图纸

技术编号:42371190 阅读:20 留言:0更新日期:2024-08-16 14:53
本发明专利技术提供一种音频事件检测方法、装置、电子设备、存储介质及产品,包括:获取音频信号的声谱图;将声谱图输入预先训练好的音频事件检测模型进行处理;音频事件检测模型包括卷积核大小不同的特征提取网络以及与各个特征提取网络对应连接的分类器;通过卷积核大小不同的特征提取网络提取声谱图中不同颗粒度的时频特征,通过分类器对单个颗粒度的时频特征进行分类;根据各个分类器的输出结果,确定音频信号中包含的音频事件。本发明专利技术通过采用卷积核大小不同的特征提取网络,对不同粗细颗粒度的频域及时域特征信息进行提取,可以提升提取出的特征信息的复杂度,避免信息同质化严重的问题,有利于提高音频事件检测的准确率。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种音频事件检测方法、装置、电子设备、存储介质及产品


技术介绍

1、近年来,随着深度学习的发展,音频事件检测(audio event detection,aed)受到了越来越多的关注。在进行音频事件检测之前,通常需要从音频信号中提取相关特征,提取的这些特征可以用于表示音频信号的信息,以供深度学习模型对音频信号中的某些特征进行处理,得到音频事件的检测结果。

2、然而,传统的音频事件检测方案所采用的深度学习模型中的特征提取网络通常具有相同的视野,使得提取的特征信息同质化严重,从而导致音频事件检测的准确率较低。


技术实现思路

1、本专利技术提供一种音频事件检测方法、装置、电子设备、存储介质及产品,用以解决现有技术中传统的音频事件检测方案所采用的深度学习模型中的特征提取网络通常具有相同的视野,使得提取的特征信息同质化严重的缺陷,实现多样化的音频事件多颗粒度时频特征的提取。

2、本专利技术提供一种音频事件检测方法,包括:

3、获取音频信号的声谱图;...

【技术保护点】

1.一种音频事件检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每个特征提取网络包括卷积层、瓶颈层和注意力机制;所述通过所述卷积核大小不同的特征提取网络提取所述声谱图中不同颗粒度的时频特征,包括:

3.根据权利要求1所述的方法,其特征在于,所述音频事件检测模型通过以下方式训练得到:

4.根据权利要求3所述的方法,其特征在于,所述样本数据集包括训练数据集和测试数据集;所述根据所述样本声谱图和所述样本时频特征,对卷积核大小不同的多个待训练特征提取网络进行训练,确定用于音频事件检测的目标特征提取网络,包括:

5.根据权利要...

【技术特征摘要】

1.一种音频事件检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,每个特征提取网络包括卷积层、瓶颈层和注意力机制;所述通过所述卷积核大小不同的特征提取网络提取所述声谱图中不同颗粒度的时频特征,包括:

3.根据权利要求1所述的方法,其特征在于,所述音频事件检测模型通过以下方式训练得到:

4.根据权利要求3所述的方法,其特征在于,所述样本数据集包括训练数据集和测试数据集;所述根据所述样本声谱图和所述样本时频特征,对卷积核大小不同的多个待训练特征提取网络进行训练,确定用于音频事件检测的目标特征提取网络,包括:

5.根据权利要求4所述的方法,其特征在于,所述采用所述样本声谱图和所述样本时频特征,分别对卷积核大小不同的...

【专利技术属性】
技术研发人员:刘壮壮柳瑞波王帅鑫任玉玲赵江江
申请(专利权)人:中移在线服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1