回放攻击语音的检测方法和装置制造方法及图纸

技术编号:27940101 阅读:77 留言:0更新日期:2021-04-02 14:21
本发明专利技术提供一种回放攻击语音的检测方法和装置,所述方法包括以下步骤:获取正常语音样本和录音回放语音样本;对语音样本进行预处理,以获取声学参数的特征向量,作为样本集;通过支持向量机基于预处理后的样本集进行训练以得到支持向量机模型;获取待测语音样本,并将待测语音样本输入支持向量机模型,以得到识别结果。本发明专利技术的检测方法,不受设备种类、文本内容的影响,大大提高了检测通用性能。

【技术实现步骤摘要】
回放攻击语音的检测方法和装置
本专利技术涉及计算机
,具体涉及一种回放攻击语音的检测方法和一种回放攻击语音的检测装置。
技术介绍
目前,说话人识别(SR,SpeakerRecognition),是依据不同说话人的声道结构差异和发音习惯的不同,对其原始语音提取声纹特征矢量与相应的声纹模板进行相似性比对,来鉴别说话人身份的一项生物识别技术已经普遍适用。但是,说话人识别的应用场景包括电话或其他无人值守的分布式情况,无须人工监督或面对面的接触,因此,与其他生物特征识别过程相比,说话人识别更容易受到恶意干扰。在通过说话人识别进行身份验证的时候,如果不考虑伪造攻击的带来的威胁,那么该验证过程就不再具有现实意义。说话人识别的伪造攻击主要来源有四种,分别是:(1)说话人仿冒攻击;(2)语音合成攻击;(3)声音转换攻击;(4)录音回放攻击。其中,录音回放攻击的方式不需要相关的专业知识和技术,随着录音设备质量的不断提高、成本的不断降低,录音回放成为一种有效的、常见的仿冒攻击手段。目前的回放攻击检测方法主要包括以下几种:第一,信道差异:根据原始语音与回本文档来自技高网...

【技术保护点】
1.一种回放攻击语音的检测方法,其特征在于,包括以下步骤:/n获取正常语音样本和录音回放语音样本;/n对语音样本进行预处理,以获取声学参数的特征向量,作为样本集,其中,所述声学参数的特征向量包括:振幅微扰、声门噪声特征和平滑倒谱;/n通过支持向量机基于预处理后的样本集进行训练以得到支持向量机模型;/n获取待测语音样本,并将所述待测语音样本输入所述支持向量机模型,以得到识别结果。/n

【技术特征摘要】
1.一种回放攻击语音的检测方法,其特征在于,包括以下步骤:
获取正常语音样本和录音回放语音样本;
对语音样本进行预处理,以获取声学参数的特征向量,作为样本集,其中,所述声学参数的特征向量包括:振幅微扰、声门噪声特征和平滑倒谱;
通过支持向量机基于预处理后的样本集进行训练以得到支持向量机模型;
获取待测语音样本,并将所述待测语音样本输入所述支持向量机模型,以得到识别结果。


2.根据权利要求1所述的回放攻击语音的检测方法,其特征在于,对语音样本进行预处理,以获取声学参数的特征向量,包括:
提取所述语音样本中的有声段;
采用自相关函数获取基音周期;
根据所述基音周期进行分帧;
对分帧后的语音信号进行特征提取,以获取振幅微扰和声门噪声特征。


3.根据权利要求2所述的回放攻击语音的检测方法,其特征在于,对分帧后的语音信号进行特征提取,以获取振幅微扰,包括:
获取分帧后的帧内幅度峰值;
计算每帧幅度峰值的差值,以获取所述振幅微扰,其中,所述振幅微扰包括:振幅微扰的相对值和三点振幅微扰商。


4.根据权利要求3所述的回放攻击语音的检测方法,其特征在于,其中,
通过下述公式获取所述振幅微扰的相对值:



其中,SL表示所述振幅微扰的相对值,A(i)(i=1,2,3…,N)表示峰值振幅参数,N表示峰值振幅个数;
通过下述公式获取所述三点振幅微扰商:



其中,APQ3表示所述三点振幅微扰商。


5.根据权利要求2所述的回放攻击语音的检测方法,其特征在于,对分帧后的语音信号进行特征提取,以获取声门噪声特征,其中,所述声门噪声特征包括:平均自相关和谐噪比,包括:
获取每帧波的自相关;
计算所有自相关的平均值,作为平均自相关;
计算按周期截断的时域信号波幅值序列的平均幅值序列,并计算每个截断信号与平均波的差值;
根据所述按周期截断的时域信号波幅值序列的平均幅值序列和所述每个截断信号与平均波的差值获取谐噪比。

【专利技术属性】
技术研发人员:周颖慧孟子厚刘亚丽
申请(专利权)人:中国传媒大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1