一种基于频域信息量分布的回放语音检测方法技术

技术编号：14559581 阅读：97 留言：0更新日期：2017-02-05 14:41

本发明专利技术公开了一种基于频域信息量分布的回放语音检测方法，属于一种通过研究原始语音和回放语音在固定频率范围上信息量的分布，从而提出了可用于检测回放语音的方法，而通过这种检测方法可有效检测语音是否为回放语音，这种回放语音检测方法能够有效检测来自偷录设备的回放语音，并在回放环境改变情况下，也具备较高的检测准确性；同时，本发明专利技术也验证了检测回放语音检测算法具有较好的鲁棒性，采用这种基于频域信息量分布的回放语音检测方法还具有操作简单、适用范围广、检测准确率高等优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及回放语音的检测识别方法，具体是指一种基于频域信息量分布的回放语音检测方法。
技术介绍
目前，说话人识别系统作为语音识别的重要分支，正以其自身优势，如拾音设备简单、接受度高、非现场性等而逐步受到重视，并广泛应用于生活的各个方面，如司法取证、社保系统、普通生活等。然而，说话人识别系统往往存在假冒者攻击的潜在威胁，其安全性已成为人们关注的焦点，假冒者主要通过以下两种方法实施攻击：一、假冒者使用口技模仿合法用户发言方式进行攻击；二、假冒者使用专业技术进行攻击。对于第一种攻击方式，除非假冒者有很高的技巧才能攻击成功，一般人很难做到，并且现有的说话人识别技术已经能够做到阻止此类假冒者的闯入；对于第二种攻击方式，主要分为合成特定人语音、特定人语音拼接、回放语音等，其中前两种攻击手段需要假冒者具备相关专业知识，假冒者一般难以实施攻击，而对于回放语音攻击认证系统则具有其他攻击手段没有的优点，随着低价格、高保真录音设备的普及，语音来源于合法用户本人，自然度高，假冒者无需专业知识，操作简单，这也使得回放语音攻击说话人识别系统变的简单、成功率高，对说话人识别系统造成很大的威胁。针对回放语音攻击认证系统的检测，不少检测回放语音攻击检测方法也有被提出，如Wang等人根据回放语音是来自录制某一次合法语音这一原理，首次提出检测待测语音与合法语音语谱图相似度的算法；Jakbu等人则在检测语谱图相似度的基础上进一步改善算法，将...

【技术保护点】
一种基于频域信息量分布的回放语音检测方法，其特征在于该检测方法包括如下步骤：步骤一、提取语音信号的语音频率信息量，设待测语音信号或原始语音信号为X，将待检测语音信号如下操作：（1）将语音信号做分帧处理，设共T帧，然后第i帧语音采样值做N点离散傅里叶变换，所述N为256、512、1024；则第i帧短时傅里叶变换为：（N=256/512/1024），并按照公式一进行计算，公式一，（0≤k≪N‑1）式中：Xi——傅里叶变换数值；K——傅里叶变换的离散频率参数；n——语段语音信号中每个采样点；（2）按照公式二对第j帧第i个频率点的频率值(K)，求幅值；公式二，式中：——第i帧j列的傅里叶变换数值；K——傅里叶变换的离散频率参数；（3）按照公式三对第j点频率求其时间上的平均；公式三，式中：Yj(k) ——表示第j个频率值在时间上的平均；——第i帧j列的傅里叶变换数值；（4）按照公式四对总频率点上频率值求和；公式四，式中：S(k) ——表示各频率值之和；Yj(k) ——表示第j个频率值在时间上的平均；（5）按照公式五求每一个频率点出现的概率；公式五，式中：Pj——表示第j个频率值占总频率值的比重；...

【技术特征摘要】
1.一种基于频域信息量分布的回放语音检测方法，其特征在于该检测方法包括如下步
骤：
步骤一、提取语音信号的语音频率信息量，设待测语音信号或原始语音信号为X，将待
检测语音信号如下操作：
（1）将语音信号做分帧处理，设共T帧，然后第i帧语音采样值做N点离散傅里叶变换，所
述N为256、512、1024；则第i帧短时傅里叶变换为：（N=256/512/1024），并按照公式一进行计
算，
公式一，
（0≤k?N-1）
式中：
Xi——傅里叶变换数值；
K——傅里叶变换的离散频率参数；
n——语段语音信号中每个采样点；
（2）按照公式二对第j帧第i个频率点的频率值(K)，求幅值；
公式二，
式中：
——第i帧j列的傅里叶变换数值；
K——傅里叶变换的离散频率参数；
（3）按照公式三对第j点频率求其时间上的平均；
公式三，
式中：
Yj(k)——表示第j个频率值在时间上的平均；
——第i帧j列的傅里叶变换数值；
（4）按照公式四对总频率点上频率值求和；
公式四，
式中：
S(k)——表示各频率值之和；
Yj(k)——表示第j个频率值在时间上的平均...

【专利技术属性】
技术研发人员：王让定，陈亚楠，严迪群，金超，陶表犁，张立，
申请(专利权)人：宁波大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人