深度合成音频检测系统及方法技术方案

技术编号：39121839 阅读：11 留言：0更新日期：2023-10-23 14:46

本发明专利技术公开一种深度合成音频检测系统及方法，包括：特征提取模块，用于提取音频的特征；所述语音增强模块，用于对音频进行噪声抑制：所述注意力融合模块，与语音增强模块相连接，用于语音增强前后的音频进行注意力权重融合；知识蒸馏模块，与注意力融合模块相连接，用于并行的大参数量判别器、轻量级判别器对音频进行检测区分真伪，并通过知识蒸馏迁移大参数量判别器的知识到轻量级判别器上。本发明专利技术既提升了噪声场景下的检测性能，又在噪声场景下仍然保持鲁棒性。然保持鲁棒性。然保持鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
深度合成音频检测系统及方法

[0001]本专利技术涉及深度合成音频检测
，具体涉及深度合成音频检测系统及方法。

技术介绍

[0002]经检索，中国专利CN113488073A公开了“一种基于多特征融合的伪造语音检测方法及装置”，其通过提取语音中的多种特征，通过特征缩放和特征平衡矩阵将提取的特征进行融合获得融合特征，融合特征尽可能的融合了语音中的特征，然后利用融合特征训练基于长短期记忆网络的伪造语音检测模型，实现对各种伪造语音方法生成的伪造语音的检测。
[0003]但是，现有技术依然存在以下问题，目前深度合成音频检测在无噪场景下的性能已较为完善，但应对噪声干扰能力不足，且信噪比越低越明显。一方面，现今相关的技术研究多集中在数据增广方面，会明显提高训练成本，另一方面，有部分使用语音增强来进行降噪的研究，但在失真问题对下游任务的干扰方面没有考虑更好的解决方法。

技术实现思路

[0004]针对现有技术的不足，本专利技术提供了一种深度合成音频检测系统及方法，既提升了噪声场景下的检测性能，又在噪声场景下仍然保持鲁棒性。
[0005]为实现上述目的，本专利技术提供了一种合成音频检测系统，包括：
[0006]特征提取模块，用于提取音频的特征；
[0007]所述语音增强模块，用于对音频进行噪声抑制；
[0008]所述注意力融合模块，与语音增强模块相连接，用于语音增强前后的音频进行注意力权重融合；
[0009]知识蒸馏模块，与注意力融合模块相连接，用于并行的大参数量判...

【技术保护点】

【技术特征摘要】
1.一种深度合成音频检测系统，其特征在于：包括：特征提取模块，用于提取音频的特征；所述语音增强模块，用于对音频进行噪声抑制；所述注意力融合模块，与语音增强模块相连接，用于语音增强前后的音频进行注意力权重融合；知识蒸馏模块，与注意力融合模块相连接，用于并行的大参数量判别器、轻量级判别器对音频进行检测区分真伪，并通过知识蒸馏迁移大参数量判别器的知识到轻量级判别器上。2.根据权利要求1所述的深度合成音频检测系统，其特征在于：所述注意力融合模块采用语音增强模块的输出特征和原始音频的输入特征相减得到含噪特征，计算含噪特征与去噪特征两者之间的信噪比，并将得到的信噪比送入两层注意力网络，得到自相关矩阵，根据所述自相关矩阵进行非线性激活，作为原始含噪特征的权重与去噪特征加权融合。3.根据权利要求2所述的深度合成音频检测系统，其特征在于：所述注意力网络为时间注意力网络、频率注意力网络、空间注意力网络或通道注意力网络。4.根据权利要求1所述的深度合成音频检...

【专利技术属性】
技术研发人员：温正棋，王小鹏，
申请(专利权)人：中科极限元杭州智能科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人