【技术实现步骤摘要】
本申请涉及语音欺骗检测,特别涉及一种基于特征增强注意力机制的语音欺骗检测方法。
技术介绍
1、随着语音合成系统性能的不断完善,合成的语音质量逐渐难以被人耳区分,这对人们日常生活中的安全问题带来了很大的困扰。人们发现通过使用合成的语音或者对语音进行回放可以很容易地欺骗asv(automatic speaker verification,自动说话人验证)系统,使其做出错误的判断,于是对伪造语音及合成语音进行欺骗检测,成为成为asv中的一个热点问题。
2、为了构建高效的语音欺骗检测系统,现有的方法分别集中在特征工程和模型设计两个方面。特征工程方面,1、提取语音的cqcc(constant q cepstral coefficients,常数q倒谱系数)特征在捕获表明欺骗攻击的操纵伪影的迹象方面更有效;2、使用前端特征的分数级融合检测合成语音,通过关注与幅度、相位和音调变化相关的三种伪影提高特征所包含的伪造信息,在基于gmm(gaussian mixture model,高斯混合模型)分类器的模型中取得了最佳性能;3、从cqt(co
...【技术保护点】
1.一种基于特征增强注意力机制的语音欺骗检测方法,其特征在于,包括训练阶段和测试阶段;
2.根据权利要求1所述的基于特征增强注意力机制的语音欺骗检测方法,其特征在于,步骤2所述的将获取训练语料进行预处理,其具体步骤为:训练语料的采样率设置为16kHz,帧长大小为20ms,帧重叠为10ms,然后将帧数固定为750,表示为声学特征X。
3.根据权利要求1所述的基于特征增强注意力机制的语音欺骗检测方法,其特征在于,采用卷积神经网络的结构构建检测模型,包括如下子步骤:
4.根据权利要求3所述的基于特征增强注意力机制的语音欺骗检测方法,其特征
...【技术特征摘要】
1.一种基于特征增强注意力机制的语音欺骗检测方法,其特征在于,包括训练阶段和测试阶段;
2.根据权利要求1所述的基于特征增强注意力机制的语音欺骗检测方法,其特征在于,步骤2所述的将获取训练语料进行预处理,其具体步骤为:训练语料的采样率设置为16khz,帧长大小为20ms,帧重叠为10ms,然后将帧数固定为750,表示为声学特征x。
3.根据权利要求1所述的基于特征增强注意力机制的语音欺骗检测方法,其特征在于,采用卷积神经网络的结构构建检测模型,包括如下子步骤:
4.根据权利要求3所述的基于特征增强注意力机制的语音欺骗检测方法,其特征在于,所述特征提取,包括:4个二维卷积层、4个残差卷积模块、3个批归一化层、3个relu激活函数、1个二维最大池化层和1个特征增强注意力机制,残差卷积模块由5个卷积层、4个批归一化层和4个relu激活函数组成,特征增强注意力机制由1个局部编码模块和1个全局感知模块组成,局部编码模块由5个卷积层、6个批归一化层、5个relu激活函数、1个编码层、1个平均层、1个线性层和1个sigmoid激活函数组成,全局感知模块由2个组归一化层、1个深度卷积层、1个感知机层和2个通道缩放层组成。
5.根据权利要求4所述的基于...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。