基于特征增强注意力机制的语音欺骗检测方法技术

技术编号：41944534 阅读：13 留言：0更新日期：2024-07-10 16:34

本发明专利技术公开了一种基于特征增强注意力机制的语音欺骗检测方法，包括训练阶段和测试阶段，在训练阶段获取训练语料并进行预处理，构建语音欺骗检测模型，将训练语料的声学特征输入到检测模型中进行模型训练，检测模型包括特征提取和分类两大部分，在特征提取中提出特征增强注意力机制，包括局部编码模块和全局感知模块，局部编码模块用于聚合局部特征区域，全局感知模块用于捕获特征的全局远程依赖关系，然后将提取到的局部特征和全局特征进行融合得到增强特征，并输入至分类器中进行真伪分类；然后在测试阶段完成对真实语音和合成语音真伪的检测，实现高质量的语音欺骗检测。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音欺骗检测，特别涉及一种基于特征增强注意力机制的语音欺骗检测方法。

技术介绍

1、随着语音合成系统性能的不断完善，合成的语音质量逐渐难以被人耳区分，这对人们日常生活中的安全问题带来了很大的困扰。人们发现通过使用合成的语音或者对语音进行回放可以很容易地欺骗asv(automatic speaker verification,自动说话人验证)系统，使其做出错误的判断，于是对伪造语音及合成语音进行欺骗检测，成为成为asv中的一个热点问题。

2、为了构建高效的语音欺骗检测系统，现有的方法分别集中在特征工程和模型设计两个方面。特征工程方面，1、提取语音的cqcc(constant q cepstral coefficients,常数q倒谱系数)特征在捕获表明欺骗攻击的操纵伪影的迹象方面更有效；2、使用前端特征的分数级融合检测合成语音，通过关注与幅度、相位和音调变化相关的三种伪影提高特征所包含的伪造信息，在基于gmm(gaussian mixture model,高斯混合模型)分类器的模型中取得了最佳性能；3、从cqt(constant q t本文档来自技高网...

【技术保护点】

1.一种基于特征增强注意力机制的语音欺骗检测方法，其特征在于，包括训练阶段和测试阶段；

2.根据权利要求1所述的基于特征增强注意力机制的语音欺骗检测方法，其特征在于，步骤2所述的将获取训练语料进行预处理，其具体步骤为：训练语料的采样率设置为16kHz，帧长大小为20ms，帧重叠为10ms，然后将帧数固定为750，表示为声学特征X。

3.根据权利要求1所述的基于特征增强注意力机制的语音欺骗检测方法，其特征在于，采用卷积神经网络的结构构建检测模型，包括如下子步骤：

4.根据权利要求3所述的基于特征增强注意力机制的语音欺骗检测方法，其特征在于，所述特征提取，...

【技术特征摘要】

1.一种基于特征增强注意力机制的语音欺骗检测方法，其特征在于，包括训练阶段和测试阶段；

2.根据权利要求1所述的基于特征增强注意力机制的语音欺骗检测方法，其特征在于，步骤2所述的将获取训练语料进行预处理，其具体步骤为：训练语料的采样率设置为16khz，帧长大小为20ms，帧重叠为10ms，然后将帧数固定为750，表示为声学特征x。

3.根据权利要求1所述的基于特征增强注意力机制的语音欺骗检测方法，其特征在于，采用卷积神经网络的结构构建检测模型，包括如下子步骤：

4.根据权利要求3所述的基于特征增强注意力机制的语音欺骗检测方法，其特征在于，所述特征提取，包括：4个二维卷积层、4个残差卷积模块、3个批归一化层、3个relu激活函数、1个二维最大池化层和1个特征增强注意力机制，残差卷积模块由5个卷积层、4个批归一化层和4个relu激活函数组成，特征增强注意力机制由1个局部编码模块和1个全局感知模块组成，局部编码模块由5个卷积层、6个批归一化层、5个relu激活函数、1个编码层、1个平均层、1个线性层和1个sigmoid激活函数组成，全局感知模块由2个组归一化层、1个深度卷积层、1个感知机层和2个通道缩放层组成。

5.根据权利要求4所述的基于...

【专利技术属性】
技术研发人员：李燕萍，谭誌诚，邵曦，丁卓，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人