【技术实现步骤摘要】
本专利技术涉及音频检测领域,特别涉及一种融合多源特征与跨尺度建模的音频深度伪造检测方法。
技术介绍
1、随着生成式人工智能的发展,结合语音处理与自然语言处理的音频语言模型取得显著进展,使得语音克隆、语音转换与文本生成语音技术愈发成熟,伪造音频的制作门槛大幅降低,而深度伪造音频在语义与语调上可高度逼真,造成虚假传播、身份欺诈的风险不断加剧,因此音频深度伪造检测成为了必不可少的一环。
2、现有技术中,传统的检测方法普遍依赖预训练模型提取的高层语音表示,缺乏对底层声学与物理特征的显式关注,难以捕捉语音生成过程中的物理规律偏差,与此同时,伪造特征常以微弱伪影的形式存在于多个时空尺度和抽象层级中,导致现有的传统检测方法无法全面覆盖全部伪造模式,易出现检测精度不足或鲁棒性差的问题。
3、因此,如何设计一种深度伪造音频检测方法,以提高对各类深度伪造音频的准确识别,成为了亟待解决的问题。
技术实现思路
1、基于此,本专利技术提出的一种融合多源特征与跨尺度建模的音频深度伪造检测方法,
...【技术保护点】
1.一种融合多源特征与跨尺度建模的音频深度伪造检测方法,其特征在于,包括:
2.根据权利要求1所述的融合多源特征与跨尺度建模的音频深度伪造检测方法,其特征在于,所述获取原始音频数据并进行数据增强处理的步骤,具体包括:
3.根据权利要求2所述的融合多源特征与跨尺度建模的音频深度伪造检测方法,其特征在于,所述感知不变扰动分支根据所述原始音频数据进行隐藏生成伪影捕捉增强的步骤,具体包括:
4.根据权利要求1所述的融合多源特征与跨尺度建模的音频深度伪造检测方法,其特征在于,所述对数据增强后的原始音频数据进行特征提取,以分别获取多层次深度音频
...【技术特征摘要】
1.一种融合多源特征与跨尺度建模的音频深度伪造检测方法,其特征在于,包括:
2.根据权利要求1所述的融合多源特征与跨尺度建模的音频深度伪造检测方法,其特征在于,所述获取原始音频数据并进行数据增强处理的步骤,具体包括:
3.根据权利要求2所述的融合多源特征与跨尺度建模的音频深度伪造检测方法,其特征在于,所述感知不变扰动分支根据所述原始音频数据进行隐藏生成伪影捕捉增强的步骤,具体包括:
4.根据权利要求1所述的融合多源特征与跨尺度建模的音频深度伪造检测方法,其特征在于,所述对数据增强后的原始音频数据进行特征提取,以分别获取多层次深度音频特征和物理声学特征的步骤,具体包括:
5.根据权利要求1所述的融合多源特征与跨尺度建模的音频深度伪造检测方法,其特征在于,所述根据所述多层次深度音频特征和物理声学特征进行特征融合...
【专利技术属性】
技术研发人员:涂敏,丁峰,吴丹,庞孟,宋子文,徐健锋,谷真真,张亮,万雪勇,肖文,
申请(专利权)人:江西警察学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。