音频检测模型的训练方法、音频检测方法以及相关装置制造方法及图纸

技术编号：41511674 阅读：27 留言：0更新日期：2024-05-30 14:50

本申请公开了音频检测模型的训练方法、音频检测方法以及相关装置，该方法包括：获取音频训练数据；音频训练数据对应有真实标签；将音频训练数据输入至已训练的第一音频检测模型，得到第一音频检测结果；将音频训练数据输入至第二音频检测模型，得到第二音频检测结果；第一音频检测模型的网络规模大于第二音频检测模型的网络规模；利用真实标签和第二音频检测结果确定第一损失值，利用第一音频检测结果和第二音频检测结果确定第二损失值，利用第二音频检测结果对应的加性角度softmax值和第一音频检测结果确定第三损失值；结合三个损失值对第二音频检测模型进行迭代训练。通过上述方式，能够提升目标音频检测模型的检测准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及音频检测，特别是涉及音频检测模型的训练方法、音频检测方法以及相关装置。

技术介绍

1、音频检测任务是一种音频处理技术，用于识别和检测音频信号中的特定事件或目标，可以是简单的声音，如拍手声、敲门声、尖叫声等，或更复杂的声音，如音乐片段、说话声或环境声音等。音频事件检测在许多领域都有广泛的作用，如音频监控、智能家居、生物声学研究等。

2、当前音频检测以深度学习技术为主要解决方法，即模型通过大量数据来学习各种音频的特征。音频检测训练数据需要标注出音频的起止时间，数据标注耗费大量人力，因而当前高质量的标注数据集较少，数据集的不足限制了模型的性能。并且，实际应用场景中的音频信号可能具有各种变化，如背景噪声、混响、音调变化等，这又需要模型在各种位置场景下具有良好的泛化能力。因此，如何在小数据集上训练出泛化能力足够强的音频检测模型具有重要意义。

技术实现思路

1、本申请提供的音频检测模型的训练方法、音频检测方法以及相关装置，能够提升目标音频检测模型的检测准确性。

2、为...

【技术保护点】

1.一种音频检测模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述利用所述第二音频检测结果对应的加性角度softmax值和所述第一音频检测结果确定第三损失值，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述第二音频检测结果获取对应的加性角度softmax值，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述音频训练数据输入至第一音频检测模型，得到第一音频检测结果之前，包括：

5.根据权利要求1所述的方法，其特征在于，所述第一音频检测模型的全连接层对应的检测类别数与所述第二音频检...

【技术特征摘要】

1.一种音频检测模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述利用所述第二音频检测结果对应的加性角度softmax值和所述第一音频检测结果确定第三损失值，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述第二音频检测结果获取对应的加性角度softmax值，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述音频训练数据输入至第一音频检测模型，得到第一音频检测结果之前，包括：

5.根据权利要求1所述的方法，其特征在于，所述第一音频检测模型的全连接层对应的检测类别数与所述第二音频检测模型的全连接层对应的检测类别数相同。

6.根据权利要求1所述的方法，其特征在于，所述将所述音频训练数据输入至第一音频检测模型，得到第一音频检测结果，包括：对所述音频训练数据进行第一数据增强，并将增强后的音频训练数据输入至第一音频检测模型，得到所述第一音频检测结果；所述将所述音频训练数据输入至第二音频检测模型，得到第二音频检测结果，包括：对所述音频训练数据进行第二数据增强，并将增强后的音频训练数据输入至第二音频检测模型，得到所述第二音频...

【专利技术属性】
技术研发人员：黄昀，吴人杰，方瑞东，林聚财，杜海云，史巍，殷俊，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人