【技术实现步骤摘要】
本专利技术涉及人工智能语音安全,更具体的说是涉及一种基于声纹驱动的伪造语音检测方法及系统。
技术介绍
1、如今语音识别与语音合成系统已广泛应用于如语音助手、身份认证、远程指令交互等多个实际场景中,成为人工智能系统中的关键模块。与此同时,伪造语音技术近年来发展迅猛,利用深度学习模型合成的伪造语音已具备高度的拟真度,能够有效欺骗语音识别系统和人类听觉系统,严重威胁语音系统在实际应用中的安全性。
2、伪造语音通常通过文本到语音(text-to-speech)或语音转换(voiceconversion)方法生成,该类伪造样本具有真实语音的频谱分布形式和听感特征,普通检测系统难以通过人耳或简单算法加以区分。攻击者可以通过合成技术模拟特定说话人音色,在无需原声语料的情况下实现跨说话人模仿,进而实施冒充攻击或身份欺诈等非法行为。
3、现有伪造语音检测方法大多基于频谱域统计特征,如线性频率倒谱系数(lfcc)、恒定q倒谱系数(cqcc)等,通过构建深度神经网络分类器对真实与伪造语音进行二分类判别。但此类方法普遍存在以下问题:其一
...【技术保护点】
1.一种基于声纹驱动的伪造语音检测方法,其特征在于,包括:
2.根据权利要求1所述的一种基于声纹驱动的伪造语音检测方法,其特征在于,所述步骤1中对语音信息进行预处理的过程包括:
3.根据权利要求1所述的一种基于声纹驱动的伪造语音检测方法,其特征在于,所述声纹识别模型使用真实语音信息进行训练,所述伪造语音检测模型使用真实与伪造语音信息同时训练,通过算法流程联合优化两个模型参数。
4.根据权利要求1所述的一种基于声纹驱动的伪造语音检测方法,其特征在于,所述声纹识别模型包括基础网络结构、多头注意力机制和特征聚合池化;
5.根据
...【技术特征摘要】
1.一种基于声纹驱动的伪造语音检测方法,其特征在于,包括:
2.根据权利要求1所述的一种基于声纹驱动的伪造语音检测方法,其特征在于,所述步骤1中对语音信息进行预处理的过程包括:
3.根据权利要求1所述的一种基于声纹驱动的伪造语音检测方法,其特征在于,所述声纹识别模型使用真实语音信息进行训练,所述伪造语音检测模型使用真实与伪造语音信息同时训练,通过算法流程联合优化两个模型参数。
4.根据权利要求1所述的一种基于声纹驱动的伪造语音检测方法,其特征在于,所述声纹识别模型包括基础网络结构、多头注意力机制和特征聚合池化;
5.根据权利要求4所述的一种基于声纹驱...
【专利技术属性】
技术研发人员:陈艳姣,徐文渊,程雨诗,张含蕾,张哲宇,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。