【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种音频事件检测方法、装置、电子设备、存储介质及产品。
技术介绍
1、近年来,随着深度学习的发展,音频事件检测(audio event detection,aed)受到了越来越多的关注。在进行音频事件检测之前,通常需要从音频信号中提取相关特征,提取的这些特征可以用于表示音频信号的信息,以供深度学习模型对音频信号中的某些特征进行处理,得到音频事件的检测结果。
2、然而,传统的音频事件检测方案所采用的深度学习模型中的特征提取网络通常具有相同的视野,使得提取的特征信息同质化严重,从而导致音频事件检测的准确率较低。
技术实现思路
1、本专利技术提供一种音频事件检测方法、装置、电子设备、存储介质及产品,用以解决现有技术中传统的音频事件检测方案所采用的深度学习模型中的特征提取网络通常具有相同的视野,使得提取的特征信息同质化严重的缺陷,实现多样化的音频事件多颗粒度时频特征的提取。
2、本专利技术提供一种音频事件检测方法,包括:
3、获取音
...【技术保护点】
1.一种音频事件检测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,每个特征提取网络包括卷积层、瓶颈层和注意力机制;所述通过所述卷积核大小不同的特征提取网络提取所述声谱图中不同颗粒度的时频特征,包括:
3.根据权利要求1所述的方法,其特征在于,所述音频事件检测模型通过以下方式训练得到:
4.根据权利要求3所述的方法,其特征在于,所述样本数据集包括训练数据集和测试数据集;所述根据所述样本声谱图和所述样本时频特征,对卷积核大小不同的多个待训练特征提取网络进行训练,确定用于音频事件检测的目标特征提取网络,包括:
...【技术特征摘要】
1.一种音频事件检测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,每个特征提取网络包括卷积层、瓶颈层和注意力机制;所述通过所述卷积核大小不同的特征提取网络提取所述声谱图中不同颗粒度的时频特征,包括:
3.根据权利要求1所述的方法,其特征在于,所述音频事件检测模型通过以下方式训练得到:
4.根据权利要求3所述的方法,其特征在于,所述样本数据集包括训练数据集和测试数据集;所述根据所述样本声谱图和所述样本时频特征,对卷积核大小不同的多个待训练特征提取网络进行训练,确定用于音频事件检测的目标特征提取网络,包括:
5.根据权利要求4所述的方法,其特征在于,所述采用所述样本声谱图和所述样本时频特征,分别对卷积核大小不同的...
【专利技术属性】
技术研发人员:刘壮壮,柳瑞波,王帅鑫,任玉玲,赵江江,
申请(专利权)人:中移在线服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。