一种融合多源特征与跨尺度建模的音频深度伪造检测方法技术

技术编号：46624363 阅读：2 留言：0更新日期：2025-10-14 21:20

本发明专利技术涉及音频检测领域，提出一种融合多源特征与跨尺度建模的音频深度伪造检测方法及系统，通过双分支数据增强策略，有效提高了对合成样本中隐蔽伪造模式的识别能力，在保持语音自然性与听觉可接受性的同时，引入具有代表性的伪造扰动空间，从而显著提高了在多类型深度伪造攻击下的泛化与鲁棒性，再分别获取多层次深度音频特征和物理声学特征并进行特征融合，提高了对物理层伪影的敏感度，进一步提高了检测准确性，还通过多尺度注意力增强，高效捕捉伪造音频中跨时间与频率尺度的微弱变化特征，通过分组卷积与多分支注意力路径的结构设计，有效整合了局部与全局感知信息，本发明专利技术提高了音频深度伪造检测的准确性、鲁棒性和泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频检测领域，特别涉及一种融合多源特征与跨尺度建模的音频深度伪造检测方法。

技术介绍

1、随着生成式人工智能的发展，结合语音处理与自然语言处理的音频语言模型取得显著进展，使得语音克隆、语音转换与文本生成语音技术愈发成熟，伪造音频的制作门槛大幅降低，而深度伪造音频在语义与语调上可高度逼真，造成虚假传播、身份欺诈的风险不断加剧，因此音频深度伪造检测成为了必不可少的一环。

2、现有技术中，传统的检测方法普遍依赖预训练模型提取的高层语音表示，缺乏对底层声学与物理特征的显式关注，难以捕捉语音生成过程中的物理规律偏差，与此同时，伪造特征常以微弱伪影的形式存在于多个时空尺度和抽象层级中，导致现有的传统检测方法无法全面覆盖全部伪造模式，易出现检测精度不足或鲁棒性差的问题。

3、因此，如何设计一种深度伪造音频检测方法，以提高对各类深度伪造音频的准确识别，成为了亟待解决的问题。

技术实现思路

1、基于此，本专利技术提出的一种融合多源特征与跨尺度建模的音频深度伪造检测方法，...

【技术保护点】

1.一种融合多源特征与跨尺度建模的音频深度伪造检测方法，其特征在于，包括：

2.根据权利要求1所述的融合多源特征与跨尺度建模的音频深度伪造检测方法，其特征在于，所述获取原始音频数据并进行数据增强处理的步骤，具体包括：

3.根据权利要求2所述的融合多源特征与跨尺度建模的音频深度伪造检测方法，其特征在于，所述感知不变扰动分支根据所述原始音频数据进行隐藏生成伪影捕捉增强的步骤，具体包括：

4.根据权利要求1所述的融合多源特征与跨尺度建模的音频深度伪造检测方法，其特征在于，所述对数据增强后的原始音频数据进行特征提取，以分别获取多层次深度音频特征和物理声学特征的...

【技术特征摘要】

1.一种融合多源特征与跨尺度建模的音频深度伪造检测方法，其特征在于，包括：

4.根据权利要求1所述的融合多源特征与跨尺度建模的音频深度伪造检测方法，其特征在于，所述对数据增强后的原始音频数据进行特征提取，以分别获取多层次深度音频特征和物理声学特征的步骤，具体包括：

5.根据权利要求1所述的融合多源特征与跨尺度建模的音频深度伪造检测方法，其特征在于，所述根据所述多层次深度音频特征和物理声学特征进行特征融合...

【专利技术属性】
技术研发人员：涂敏，丁峰，吴丹，庞孟，宋子文，徐健锋，谷真真，张亮，万雪勇，肖文，
申请(专利权)人：江西警察学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人