【技术实现步骤摘要】
本申请涉及音频检测,特别是涉及音频检测模型的训练方法、音频检测方法以及相关装置。
技术介绍
1、音频检测任务是一种音频处理技术,用于识别和检测音频信号中的特定事件或目标,可以是简单的声音,如拍手声、敲门声、尖叫声等,或更复杂的声音,如音乐片段、说话声或环境声音等。音频事件检测在许多领域都有广泛的作用,如音频监控、智能家居、生物声学研究等。
2、当前音频检测以深度学习技术为主要解决方法,即模型通过大量数据来学习各种音频的特征。音频检测训练数据需要标注出音频的起止时间,数据标注耗费大量人力,因而当前高质量的标注数据集较少,数据集的不足限制了模型的性能。并且,实际应用场景中的音频信号可能具有各种变化,如背景噪声、混响、音调变化等,这又需要模型在各种位置场景下具有良好的泛化能力。因此,如何在小数据集上训练出泛化能力足够强的音频检测模型具有重要意义。
技术实现思路
1、本申请提供的音频检测模型的训练方法、音频检测方法以及相关装置,能够提升目标音频检测模型的检测准确性。
2、为
...【技术保护点】
1.一种音频检测模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述利用所述第二音频检测结果对应的加性角度softmax值和所述第一音频检测结果确定第三损失值,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述第二音频检测结果获取对应的加性角度softmax值,包括:
4.根据权利要求1所述的方法,其特征在于,所述将所述音频训练数据输入至第一音频检测模型,得到第一音频检测结果之前,包括:
5.根据权利要求1所述的方法,其特征在于,所述第一音频检测模型的全连接层对应的检测类
...【技术特征摘要】
1.一种音频检测模型的训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述利用所述第二音频检测结果对应的加性角度softmax值和所述第一音频检测结果确定第三损失值,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述第二音频检测结果获取对应的加性角度softmax值,包括:
4.根据权利要求1所述的方法,其特征在于,所述将所述音频训练数据输入至第一音频检测模型,得到第一音频检测结果之前,包括:
5.根据权利要求1所述的方法,其特征在于,所述第一音频检测模型的全连接层对应的检测类别数与所述第二音频检测模型的全连接层对应的检测类别数相同。
6.根据权利要求1所述的方法,其特征在于,所述将所述音频训练数据输入至第一音频检测模型,得到第一音频检测结果,包括:对所述音频训练数据进行第一数据增强,并将增强后的音频训练数据输入至第一音频检测模型,得到所述第一音频检测结果;所述将所述音频训练数据输入至第二音频检测模型,得到第二音频检测结果,包括:对所述音频训练数据进行第二数据增强,并将增强后的音频训练数据输入至第二音频检测模型,得到所述第二音频...
【专利技术属性】
技术研发人员:黄昀,吴人杰,方瑞东,林聚财,杜海云,史巍,殷俊,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。