一种基于混合扩散模型的水声数据增扩方法及系统技术方案

技术编号：45426230 阅读：11 留言：0更新日期：2025-06-04 19:09

本发明专利技术公开了一种基于混合扩散模型的水声数据增扩方法及系统，该方法包括：通过提取梅尔频谱图对原始音频进行特征提取，得到混合梅尔谱图，构成训练集合；采用基于扩散的混合策略生成类间数据以及相应的混合条件标签；将混合条件标签送入条件投影层，获得条件嵌入特征，再输入扩散模型中的噪声预测模块的注意力U‑Net得到预测噪声；使用扩散模型中的变分自编码器建模预测噪声和步骤1的混合梅尔谱图数据的分布，并通过变分采样生成相应的合成梅尔频谱图，得到增扩后的训练数据。本发明专利技术首次将条件扩散模型引入水下声学数据扩增，合成不同类别水下声学信号的梅尔频谱图，为分类模型生成充足的训练数据。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于水声目标识别，尤其涉及一种基于混合扩散模型的水声数据增扩方法及系统。

技术介绍

1、水下声学目标识别在海洋环境监测、港口船舶管理和水下生态监测方面有着广泛的应用。近年来，随着深度学习在语音识别和音频降噪等领域的成功应用，许多研究人员开始将基于深度学习的方法引入水下声学目标识别任务。一方面，由于水下环境条件和船舶维护状态的综合影响，水下声学信号（如船舶辐射噪声）通常具有噪声和复杂性。这使得声学数据变化很大，对模型的泛化能力提出了很高的要求。另一方面，这些基于深度学习的方法通常需要大量数据进行训练。然而，为水下声学目标识别任务获取各种数据耗时、耗力且成本高昂。数据的稀缺会导致过度拟合的风险，从而进一步损害模型的性能。具体来说：

2、（1）结合水下信道建模生成合成数据，并利用迁移学习能够缩小合成数据与真实数据之间的域差距，但该方法生成的数据较单一，不具有数据多样性的特点；

3、（2）生成模型可以通过合成新的、真实的和可信的样本来增强数据的多样性，但是基于生成式对抗网络具有不稳定性；

4、（3）...

【技术保护点】

1.一种基于混合扩散模型的水声数据增扩方法，包括：

2.根据权利要求1所述的基于混合扩散模型的水声数据增扩方法，其特征在于，

3.根据权利要求2所述的基于混合扩散模型的水声数据增扩方法，其特征在于，所述基于扩散的混合策略包括：当和不相等时，生成类间数据。

4.根据权利要求1所述的基于混合扩散模型的水声数据增扩方法，其特征在于，所述条件投影层包括两个级联的全连接层。

5.一种基于混合扩散模型的水声数据增扩系统，其特征在于，包括：

【技术特征摘要】

1.一种基于混合扩散模型的水声数据增扩方法，包括：

2.根据权利要求1所述的基于混合扩散模型的水声数据增扩方法，其特征在于，

3.根据权利要求2所述的基于混合扩散模型的水声数据增扩方法，其特征在于，所述基于扩散的混合...

【专利技术属性】
技术研发人员：郝程鹏，马治勋，汤宁，李璇，
申请(专利权)人：中国科学院声学研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人