当前位置: 首页 > 专利查询>宁波大学专利>正文

一种基于频域信息量分布的回放语音检测方法技术

技术编号:14559581 阅读:97 留言:0更新日期:2017-02-05 14:41
本发明专利技术公开了一种基于频域信息量分布的回放语音检测方法,属于一种通过研究原始语音和回放语音在固定频率范围上信息量的分布,从而提出了可用于检测回放语音的方法,而通过这种检测方法可有效检测语音是否为回放语音,这种回放语音检测方法能够有效检测来自偷录设备的回放语音,并在回放环境改变情况下,也具备较高的检测准确性;同时,本发明专利技术也验证了检测回放语音检测算法具有较好的鲁棒性,采用这种基于频域信息量分布的回放语音检测方法还具有操作简单、适用范围广、检测准确率高等优点。

【技术实现步骤摘要】

本专利技术涉及回放语音的检测识别方法,具体是指一种基于频域信息量分布的回放语音检测方法
技术介绍
目前,说话人识别系统作为语音识别的重要分支,正以其自身优势,如拾音设备简单、接受度高、非现场性等而逐步受到重视,并广泛应用于生活的各个方面,如司法取证、社保系统、普通生活等。然而,说话人识别系统往往存在假冒者攻击的潜在威胁,其安全性已成为人们关注的焦点,假冒者主要通过以下两种方法实施攻击:一、假冒者使用口技模仿合法用户发言方式进行攻击;二、假冒者使用专业技术进行攻击。对于第一种攻击方式,除非假冒者有很高的技巧才能攻击成功,一般人很难做到,并且现有的说话人识别技术已经能够做到阻止此类假冒者的闯入;对于第二种攻击方式,主要分为合成特定人语音、特定人语音拼接、回放语音等,其中前两种攻击手段需要假冒者具备相关专业知识,假冒者一般难以实施攻击,而对于回放语音攻击认证系统则具有其他攻击手段没有的优点,随着低价格、高保真录音设备的普及,语音来源于合法用户本人,自然度高,假冒者无需专业知识,操作简单,这也使得回放语音攻击说话人识别系统变的简单、成功率高,对说话人识别系统造成很大的威胁。针对回放语音攻击认证系统的检测,不少检测回放语音攻击检测方法也有被提出,如Wang等人根据回放语音是来自录制某一次合法语音这一原理,首次提出检测待测语音与合法语音语谱图相似度的算法;Jakbu等人则在检测语谱图相似度的基础上进一步改善算法,将回放语音的检测率提高到99%以上,但此方法仅使用于文本无关说话人识别系统;张立鹏等人依据回放语音信道与原始语音信道不同和静音段包含了信号信息,提出了一种基于静音段MFCC特征检测待测语音信道方法,其等错误概率在29%左右,此算法对于静音段时间比较短的语音不能获得稳定的特征;王志峰等人通过分析各种电路器件引起原始语音和回放语音在对数功率谱低频区的差异,提出基于信道模式噪声的录音回放攻击检测方法,其等错误概率在10%左右。以上算法均是仅仅针对一种偷录设备取得检测效果,是否适用于其他偷录设备则有待研究。
技术实现思路
本专利技术所要解决的技术问题在于克服现有技术的缺陷而提供一种操作简单、适用范围广、检测准确率高的一种基于频域信息量分布的回放语音检测方法。本专利技术的技术问题通过以下技术方案实现:一种基于频域信息量分布的回放语音检测方法,其包括如下步骤:步骤一、提取语音信号的语音频率信息量,设待测语音信号或原始语音信号为X,将待检测语音信号如下操作:(1)将语音信号做分帧处理,设共T帧,然后第i帧语音采样值做N点离散傅里叶变换,所述N为256、512、1024;则第i帧短时傅里叶变换为:(N=256/512/1024),并按照公式一进行计算,公式一,(0≤k?N-1)式中:Xi——傅里叶变换数值;K——傅里叶变换的离散频率参数;n——语段语音信号中每个采样点;(2)按照公式二对第j帧第i个频率点的频率值(K),求幅值;公式二,式中:——第i帧j列的傅里叶变换数值;K——傅里叶变换的离散频率参数;(3)按照公式三对第j点频率求其时间上的平均;公式三,式中:Yj(k)——表示第j个频率值在时间上的平均;——第i帧j列的傅里叶变换数值;(4)按照公式四对总频率点上频率值求和;公式四,式中:S(k)——表示各频率值之和;Yj(k)——表示第j个频率值在时间上的平均;(5)按照公式五求每一个频率点出现的概率;公式五,式中:Pj——表示第j个频率值占总频率值的比重;Yj(k)——表示第j个频率值在时间上的平均;S(k)——表示各频率值之和;(6)按照公式六对第j频域点求信息量;公式六,式中:I(Pj)——标志第j频率点的信息量;Pj——表示第j个频率值占总频率值得比重;通过上述计算过程分别将待测语音信号和原始语音信号转换为一维数据;步骤二、选取步骤一中语音信号的前N/2个频率点的信息量作为初步特征;步骤三、从语音信号选取的初步特征中低频区特征提取部分中筛选特征集,并选取连续的频率点作为最终特征集;步骤四:通过分类器分别对回放语音信号的特征集和原始语音信号的特征集进行训练模型,将待测语音在训练模型上进行测试,并由分类器最终判断待测语音信号是否为回放语音。所述的特征集筛选工具为怀卡托智能分析环境Weka。所述的分类器为LibSVM分类器。与现有技术相比,本专利技术主要通过研究原始语音和回放语音在固定频率范围上信息量的分布,提出了一种用于检测回放语音的方法。实验结果表明,该检测方法能够有效检测来自偷录设备的回放语音,并在回放环境改变情况下,也具备较高的检测准确性;同时,也验证了检测回放语音检测算法具有较好的鲁棒性,这种回放语音检测方法还具有操作简单、适用范围广、检测准确率高等优点。附图说明图1为本专利技术检测回放语音训练和测试框图示意图。图2为不同点数时原始语音和回放语音的信息量示意图。图3为不同点数时原始语音和回放语音的信息量方差示意图。图4为爱国者录音笔R5577和索尼这两种偷录设备情况下测试得到的ROC示意图。图5为提取的优质点分别当做独立的特征进行检测并分别求其检测率的示意图。图6为获取的优质点当做特征集,得到的POC曲线图。图7为每个所选优质点当做独立特征进行测试的结果图。图8为具有防回放语音攻击的说话人识别系统示意图。具体实施方式下面将按上述附图对本专利技术实施例再作详细说明。一种基于频域信息量分布的回放语音检测方法,主要通过研究原始语音和回放语音在固定频率范围上信息量的分布,从而提出了可用于检测回放语音的方法,通过这种检测方法可有效检测语音是否为回放语音,该检测方法主要解决的问题是回放语音检测模块,它能检测送入该检测模块的语音是否为回放语音,参考图8所示使用过程,若被判为原始语音则进入说话人识别系统,若被判为回放语音则直接拒绝该语音进入说话人识别系统,通过这种方式也极大提高了说话人识别系统的使用安全性。本专利技术所述的检测方法还涉及了语音信号频域信息量分布检测回放语音算法,这是根据回放语音的产生过程而得知的,由于回放语音比原始语音多经历了一次录制和回放过程,故设备根据其种类的不同对语音信号某些频率造成的影响也是不同的,这就使得回放语音在这些频域的分布将明显区别于原始语音。因此,参照这些特性,本专利技术提出的检测方法主要本文档来自技高网
...

【技术保护点】
一种基于频域信息量分布的回放语音检测方法,其特征在于该检测方法包括如下步骤:步骤一、提取语音信号的语音频率信息量,设待测语音信号或原始语音信号为X,将待检测语音信号如下操作:(1)将语音信号做分帧处理,设共T帧,然后第i帧语音采样值做N点离散傅里叶变换,所述N为256、512、1024;则第i帧短时傅里叶变换为:(N=256/512/1024),并按照公式一进行计算,公式一,(0≤k≪N‑1)式中:Xi——傅里叶变换数值;K——傅里叶变换的离散频率参数;n——语段语音信号中每个采样点;(2)按照公式二对第j帧第i个频率点的频率值(K),求幅值;公式二,式中:——第i帧j列的傅里叶变换数值;K——傅里叶变换的离散频率参数;(3)按照公式三对第j点频率求其时间上的平均;公式三,式中:Yj(k) ——表示第j个频率值在时间上的平均;——第i帧j列的傅里叶变换数值;(4)按照公式四对总频率点上频率值求和;公式四,式中:S(k) ——表示各频率值之和;Yj(k) ——表示第j个频率值在时间上的平均;(5)按照公式五求每一个频率点出现的概率;公式五,式中:Pj——表示第j个频率值占总频率值的比重;Yj(k) ——表示第j个频率值在时间上的平均;S(k) ——表示各频率值之和;(6)按照公式六对第j频域点求信息量;公式六,式中:I(Pj) ——标志第j频率点的信息量;Pj——表示第j个频率值占总频率值得比重;通过上述计算过程分别将待测语音信号和原始语音信号转换为一维数据;步骤二、选取步骤一中语音信号的前N/2个频率点的信息量作为初步特征;步骤三、从语音信号选取的初步特征中低频区特征提取部分中筛选特征集,并选取连续的频率点作为最终特征集;步骤四:通过分类器分别对回放语音信号的特征集和原始语音信号的特征集进行训练模型,将待测语音在训练模型上进行测试,并由分类器最终判断待测语音信号是否为回放语音。...

【技术特征摘要】
1.一种基于频域信息量分布的回放语音检测方法,其特征在于该检测方法包括如下步
骤:
步骤一、提取语音信号的语音频率信息量,设待测语音信号或原始语音信号为X,将待
检测语音信号如下操作:
(1)将语音信号做分帧处理,设共T帧,然后第i帧语音采样值做N点离散傅里叶变换,所
述N为256、512、1024;则第i帧短时傅里叶变换为:(N=256/512/1024),并按照公式一进行计
算,
公式一,
(0≤k?N-1)
式中:
Xi——傅里叶变换数值;
K——傅里叶变换的离散频率参数;
n——语段语音信号中每个采样点;
(2)按照公式二对第j帧第i个频率点的频率值(K),求幅值;
公式二,
式中:
——第i帧j列的傅里叶变换数值;
K——傅里叶变换的离散频率参数;
(3)按照公式三对第j点频率求其时间上的平均;
公式三,
式中:
Yj(k)——表示第j个频率值在时间上的平均;
——第i帧j列的傅里叶变换数值;
(4)按照公式四对总频率点上频率值求和;
公式四,
式中:
S(k)——表示各频率值之和;
Yj(k)——表示第j个频率值在时间上的平均...

【专利技术属性】
技术研发人员:王让定陈亚楠严迪群金超陶表犁张立
申请(专利权)人:宁波大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1