一种基于WeSpeaker架构的隐私增强型语音伪造检测方法技术

技术编号:46587682 阅读:1 留言:0更新日期:2025-10-10 21:23
本发明专利技术涉及音频处理技术领域,尤其涉及一种基于WeSpeaker架构的隐私增强型语音伪造检测方法,在具体使用时,本方法包括三个阶段,第一个阶段是音频输入与隐私保护预处理阶段,该阶段通过声学‑语义解耦技术实现语音内容的隐私保护。第二个阶段是基于改进WeSpeaker的特征提取阶段,利用轻量改进的WeSpeaker架构进行音频特征的深度提取。第三个阶段是伪造判别与决策阶段,通过轻量级全连接二分类层对提取的特征进行“真实/伪造”的判别。最终将给出音频是否伪造的检测结果。以此方式解决了现有技术中的语音伪造检测技术在实际使用时,存在隐私泄露风险、模型复杂度高且目标任务不匹配、泛化能力受限的技术问题。

【技术实现步骤摘要】

本专利技术涉及音频处理,尤其涉及一种基于wespeaker架构的隐私增强型语音伪造检测方法。


技术介绍

1、随着人工智能生成内容(aigc)技术的快速发展,语音合成系统(text-to-speech,tts)已能够生成高度自然、几可乱真的人类语音。特别是近年来深度神经网络(dnn)、扩散模型、多说话人建模与音色迁移技术的持续进步,使得攻击者可以利用公开tts工具在短时间内合成目标说话人的仿冒语音,进而实施身份欺诈、语音操控、社交诈骗等安全攻击。为此,语音伪造检测(anti-spoofing)作为语音安全领域的重要研究方向,致力于自动识别语音是否由合成系统或重放攻击生成,是现代语音识别、声纹识别、语音助手等系统部署中的核心安全防线。与此同时,随着对数据隐私的重视,越来越多的研究开始关注如何在不暴露语义信息的前提下进行语音识别或语音安全检测。

2、在现有技术中的相关实现方案包括基于声纹特征的检测、基于深度学习的端到端检测方法以及基于内容剥离与隐私解耦的伪造检测机制,然而,现有方式存在如下问题:

3、1、对语义内容的强依赖导致隐私泄露风险本文档来自技高网...

【技术保护点】

1.一种基于WeSpeaker架构的隐私增强型语音伪造检测方法,其特征在于,

2.如权利要求1所述的基于WeSpeaker架构的隐私增强型语音伪造检测方法,其特征在于,

3.如权利要求1所述的基于WeSpeaker架构的隐私增强型语音伪造检测方法,其特征在于,

4.如权利要求3所述的基于WeSpeaker架构的隐私增强型语音伪造检测方法,其特征在于,

5.如权利要求3所述的基于WeSpeaker架构的隐私增强型语音伪造检测方法,其特征在于,

6.如权利要求3所述的基于WeSpeaker架构的隐私增强型语音伪造检测方法,其特征在于...

【技术特征摘要】

1.一种基于wespeaker架构的隐私增强型语音伪造检测方法,其特征在于,

2.如权利要求1所述的基于wespeaker架构的隐私增强型语音伪造检测方法,其特征在于,

3.如权利要求1所述的基于wespeaker架构的隐私增强型语音伪造检测方法,其特征在于,

4.如权利要求3所述的基于wespeaker架构的隐私增强型语音伪造检测方法,其特征在于,

5.如权利要求3所述的基于wespeaker架构的隐...

【专利技术属性】
技术研发人员:邢旭阳丁卓吴晓链
申请(专利权)人:南京龙垣信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1