录音回放攻击的检测方法及对应检测模型的训练方法技术

技术编号:23162914 阅读:41 留言:0更新日期:2020-01-21 22:13
本发明专利技术公开了一种录音回放攻击的检测方法及对应检测模型的训练方法。其中录音回放攻击检测模型的训练方法,包括:获取语音数据并预处理,所述语音数据包括回放语音数据和真实语音数据;将每一条语音数据进行分帧处理,然后将每一条语音数据的各帧数据进行加窗、快速傅里叶变换处理;将每一条语音数据进行快速傅里叶变换处理后的各帧数据采用倒梅尔、子带频率质心、子带幅值质心滤波器当中的任意一种或多种进行特征提取得到对应的特征矩阵,将每一种语音数据的所有特征矩阵分别通过EM算法对GMM进行迭代运算直至收敛,得到每一种回放语音数据和每一种真实语音数据的至少一个模型分类器。本发明专利技术可以更加准确验证待测音频具体是什么类型的音频。

Detection method of recording playback attack and training method of corresponding detection model

【技术实现步骤摘要】
录音回放攻击的检测方法及对应检测模型的训练方法
本专利技术涉及说话人声纹身份认证系统领域,尤其涉及一种基于信道特征模式分析的录音回放攻击的检测方法,以及该检测方法采用的检测模型的训练方法。
技术介绍
声纹是一种重要的生物认证依据,具有获取方便、设备成本低廉、适合远程认证等特点。针对声纹身份认证系统的攻击,即有生物认证系统攻击的共性,又有其特殊性。声纹认证系统的音源端攻击主要有录音回放攻击、说话人仿冒攻击、伪造认证语音攻击3种。录音回放攻击是指攻击者采用高保真的录音设备录制合法用户进入认证系统时的语音,或通过其他各种手段获得用户的语音样本,然后在声纹身份认证系统的拾音器端通过高保真功放回放,从而达到对声纹身份认证系统实施攻击的目的。随着科技的发展,高质量的廉价录音/播放设备日益增多,而且体积小,实施偷录容易,因此录音回放攻击已成为声纹身份认证系统中最容易实施的攻击。随着声纹身份系统的不断推广应用,其危害性日益凸显,因此录音回放检测研究变得越来越迫切。为了解决以上问题,人们认为静音不受语音信号的影响能够更好地体现信道信息,从静音中提本文档来自技高网...

【技术保护点】
1.一种录音回放攻击检测模型的训练方法,其特征在于,包括步骤:/n步骤1,获取多条语音数据并进行预处理,所述多条语音数据包括至少一种回放语音数据和至少一种真实语音数据;/n步骤2,将每一条所述语音数据进行分帧处理形成M帧数据,然后将每一条语音数据的M帧数据依次进行加窗、快速傅里叶变换处理;/n步骤3,将每一条语音数据进行快速傅里叶变换处理后的M帧数据采用至少一个滤波器进行特征提取得到对应的特征矩阵,所述滤波器包括倒梅尔滤波器、子带频率质心滤波器和子带幅值质心滤波器当中的任意一种或多种;/n步骤4,将每一种所述语音数据的所有特征矩阵分别通过EM算法对GMM进行迭代运算直至收敛,得到每一种回放语音...

【技术特征摘要】
1.一种录音回放攻击检测模型的训练方法,其特征在于,包括步骤:
步骤1,获取多条语音数据并进行预处理,所述多条语音数据包括至少一种回放语音数据和至少一种真实语音数据;
步骤2,将每一条所述语音数据进行分帧处理形成M帧数据,然后将每一条语音数据的M帧数据依次进行加窗、快速傅里叶变换处理;
步骤3,将每一条语音数据进行快速傅里叶变换处理后的M帧数据采用至少一个滤波器进行特征提取得到对应的特征矩阵,所述滤波器包括倒梅尔滤波器、子带频率质心滤波器和子带幅值质心滤波器当中的任意一种或多种;
步骤4,将每一种所述语音数据的所有特征矩阵分别通过EM算法对GMM进行迭代运算直至收敛,得到每一种回放语音数据和每一种真实语音数据的至少一个模型分类器GMMplayback和GMMreal。


2.如权利要求1所述的录音回放攻击检测模型的训练方法,其特征在于,所述回放语音数据和真实语音数据为脉冲编码调制格式数据。


3.如权利要求1所述的录音回放攻击检测模型的训练方法,其特征在于,将每一条语音数据进行快速傅里叶变换处理后的M帧数据采用倒梅尔滤波器进行特征提取得到对应的特征矩阵具体包括步骤:
设定频率下限Flower和频率上限Fupper;
MFlower=1125ln(1+Flower/700)
通过公式MFupper=1125ln(1+Fupper/700)计算每一帧数据的频率下限和频率上限的梅尔频率值;
将频率下限和频率上限的梅尔频率值[MFlower,Fupper]均分为NIMFCC份;
均分点的数组记录为[MF1,MF2,...,MFP],其中P=NIMFCC+2;
计算梅尔频率均分点的频率值,得到频率数组[F1,F2,...,FP],其中,Fi=700(exp(MFi/1125)-1);
映射频率数组[F1,F2,...,FP]到频率节点数组[K1,K2,...,KP],其中,Ki=floor((NFFT+1)Fi/Ns),NFFT为快速傅里叶变换的长度,Ns为分帧处理时的采样率;
根据[K1,K2,...,KP]构造三角滤波器组Hi(n),i=1至NIMFCC;



将每个滤波器Hi(n)数组进行逆序处理得到Ri(n),得到逆序梅尔滤波器组R;
将滤波器组R与进行快速傅里叶变换处理后的帧数据进行NIMFCC次点乘运算,获得NIMFCC维向量[V1,V2,...,VNIMFCC],其中所述FFT(n)为快速傅里叶变化处理后的数据;
每一条音频数据处理结束时得到M*NIMFCC的特征矩阵。


4.如权利要求1所述的录音回放攻击检测模型的训练方法,其特征在于,将每一条语音数据进行快速傅里叶变换处理后的M帧数据采用子带频率质心滤波器进行特征提取得到对应的特征矩阵具体包括步骤:
设定频率下限Flower和频率上限Fupper;
将每一帧数据在频率上限和频率下限范围[...

【专利技术属性】
技术研发人员:葛亮
申请(专利权)人:国微集团深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1