一种基于少量强标注数据的声音事件检测方法和装置制造方法及图纸

技术编号:40594628 阅读:22 留言:0更新日期:2024-03-12 21:56
本发明专利技术提供一种基于少量强标注数据的声音事件检测方法和装置,该方法包括:S1、构建在大量弱标注数据下的音频预训练模型;S2、采用少量强标注数据训练得到初步的声音事件检测网络;S3、通过音频预训练模型获取强标注数据的特征;S4、将强标注数据的特征输入初步的声音事件检测网络中进行训练,得到训练后的声音事件检测模型;S5、将待预测的音频输入到训练后的声音事件检测模型中,检测待预测的音频中的声音事件。解决强标注数据收集和标记困难,尤其针对一些特殊应用领域,难以利用少量数据实现声音事件检测模型训练的问题。

【技术实现步骤摘要】

本专利技术属于音频信号处理,具体涉及一种基于少量强标注数据的声音事件检测方法和装置


技术介绍

1、声音事件检测具体定义为:从音频时序数据中检测出感兴趣的声音事件,将其划分到正确的设定类别中,同时标记出声音事件发生在音频时序数据中的开始和结束时刻。声音事件检测技术可以应用于监听和异常检测相关的很多场景中,例如安防监控中可以用于监测一些异常声音如爆炸等。在工业制造领域也可以用于机械异常工作声音的监测。也可以对智能家居生活中的声音进行监测和反馈。因此,声音事件检测技术极具实用价值。

2、现实生活中的声音事件常常会伴随发生,声音事件发生的时长也是变化不断的,这就导致数据的收集和标注都十分困难。早期的声音事件检测采用的是隐马尔可夫模型、随机森林回归、支持向量机等方法。随着深度学习的不断发展,越来越多的基于深度学习的方法在表现上确实优于传统的方法,但是深度学习的方法需要大量的数据支撑,但由于声音的复杂性导致数据收集困难,对声音事件类别和发生的起止时刻正确标注也需要耗费巨大的人力物力。尤其是对事件发生的起止时刻标注,这需要对每一个时间的时刻进行判断标记,才本文档来自技高网...

【技术保护点】

1.一种基于少量强标注数据的声音事件检测方法,其特征在于,包括:

2.根据权利要求1所述的声音事件检测方法,其特征在于,构建在大量弱标注数据下的音频预训练模型,包括:

3.根据权利要求2所述的声音事件检测方法,其特征在于,音频特征包括:对数梅尔频谱特征和一维时序卷积特征。

4.根据权利要求1所述的声音事件检测方法,其特征在于,采用少量强标注数据训练得到初步的声音事件检测网络,包括:

5.根据权利要求2所述的声音事件检测方法,其特征在于,通过音频预训练模型获取强标注数据的特征,包括:

6.根据权利要求1所述的声音事件检测方法,其特...

【技术特征摘要】

1.一种基于少量强标注数据的声音事件检测方法,其特征在于,包括:

2.根据权利要求1所述的声音事件检测方法,其特征在于,构建在大量弱标注数据下的音频预训练模型,包括:

3.根据权利要求2所述的声音事件检测方法,其特征在于,音频特征包括:对数梅尔频谱特征和一维时序卷积特征。

4.根据权利要求1所述的声音事件检测方法,其特征在于,采用少量强标注数据训练得到初步的声音事件检测网络,包括:

5.根据权利要求2所述的声音事件检测...

【专利技术属性】
技术研发人员:袁涛张晗亮于泽李斌朱旭彤黎涛
申请(专利权)人:中国航空工业集团公司成都飞机设计研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1