一种归一化常Q倒谱特征的回放语音检测方法技术

技术编号：20162426 阅读：22 留言：0更新日期：2019-01-19 00:15

本发明专利技术提供一种高鲁棒性的归一化常Q倒谱特征的回放语音检测方法，包括提取原始语音和回放语音的语音信息X(n)的声学特征CQCC系数；对原始语音和回放语音的CQCC系数进行倒谱均值和方差归一化处理，得到归一化的CQCC系数；将该系数置于混合高斯模型中进行训练，得到原始语音模型和回放语音模型；提取待测语音的语音信息X(n)的声学特征CQCC系数；对待测语音的CQCC系数进行倒谱均值和方差归一化处理，得到归一化的CQCC系数；将待测语音归一化的CQCC系数置于原始语音模型和回放语音模型中进行匹配，并判断待测语音归一化的CQCC系数与回放语音模型的第一匹配度是否大于等于与原始语音模型的第二匹配度，若是，则为回放语音，若否，则不是回放语音。

全部详细技术资料下载

【技术实现步骤摘要】
一种归一化常Q倒谱特征的回放语音检测方法
本专利技术涉及回放语音的检测识别方法，具体是指一种归一化常Q倒谱特征的回放语音检测方法。
技术介绍
随着现代社会的不断发展，信息安全问题日显突出，其中身份认证在信息安全防护中承担着至关重要的作用。密码是最常见的身份认证方式之一，但其存在容易被遗忘、安全性低等问题，因此国内外学者提出了将人体特征应用于身份认证的生物识别技术，而声纹识别技术就是其中之一。相较于指纹、人脸等生物认证方式，声纹具有易采集、可远程等特点，因而被广泛应用于公安、金融等领域。近年来，随着语音处理技术的快速发展，出现了诸如合成转换、电子变调以及录音回放等声纹伪造攻击手段，对基于声纹的身份认证系统构成了严重威胁。其中录音回放攻击是一种简单且易操作的攻击手段，攻击者通过隐蔽性较高的录音设备，对目标说话人的语音进行偷录，并以偷录的语音来欺骗声纹认证系统。这类攻击由于不需要对回放语音进行额外的操作，从而避免了因修改语音而留下操作痕迹，同时回放语音与原始语音具有较高的相似度，现有的声纹认证系统通常无法正确判断两者之间的差别。现有技术中针对回放语音的检测方法，按检测原理的不同，可以分为基于语音产生随机性的方法、基于语音信道特性的方法以及基于深度学习的方法：由于同一个人在不同时刻说出相同的内容所产生的语音信息存在较大的随机性，Shang等人提出了一种基于语音产生随机性的回放语音检测算法，该算法通过比较原始语音与待测语音在波峰图上的差异，判断其是否为回放语音，在随后的研究中，作者又通过得分归一化的方法对检测算法进行了改进；JakubGalka等则在Shang算法的...

【技术保护点】
1.一种归一化常Q倒谱特征的回放语音检测方法，其特征在于包括以下步骤：S1：提取原始语音和回放语音的语音信息X(n)的声学特征常Q倒谱系数(CQCC)；S2：对原始语音和回放语音的CQCC系数进行倒谱均值和方差归一化处理，得到归一化的CQCC系数；S3：分别将原始语音和回放语音归一化的CQCC系数置于混合高斯模型(GMM)中进行训练，得到原始语音模型和回放语音模型；S4：提取待测语音的语音信息X(n)的声学特征CQCC系数；S5：对待测语音的CQCC系数进行倒谱均值和方差归一化处理，得到归一化的CQCC系数；S6：将待测语音归一化的CQCC系数置于原始语音模型和回放语音模型中进行匹配，并判断待测语音归一化的CQCC系数与回放语音模型的第一匹配度是否大于等于与原始语音模型的第二匹配度，若是，则为回放语音，若否，则不是回放语音。

【技术特征摘要】
1.一种归一化常Q倒谱特征的回放语音检测方法，其特征在于包括以下步骤：S1：提取原始语音和回放语音的语音信息X(n)的声学特征常Q倒谱系数(CQCC)；S2：对原始语音和回放语音的CQCC系数进行倒谱均值和方差归一化处理，得到归一化的CQCC系数；S3：分别将原始语音和回放语音归一化的CQCC系数置于混合高斯模型(GMM)中进行训练，得到原始语音模型和回放语音模型；S4：提取待测语音的语音信息X(n)的声学特征CQCC系数；S5：对待测语音的CQCC系数进行倒谱均值和方差归一化处理，得到归一化的CQCC系数；S6：将待测语音归一化的CQCC系数置于原始语音模型和回放语音模型中进行匹配，并判断待测语音归一化的CQCC系数与回放语音模型的第一匹配度是否大于等于与原始语音模型的第二匹配度，若是，则为回放语音，若否，则不是回放语音。2.根据权利要求1所述的归一化常Q倒谱特征的回放语音检测方法，其特征在于，步骤S1中，提取CQCC系数包括对语音信息X(n)做CQT变换得到XCQT(k)，计算功率谱得到|XCQT(k)|2，进行对数变换得到log|XCQT(k)|2，进行均匀重采样得到log|XCQT(i)|2，进行DCT变换得到CQCC(p).3.根据权利要求2所述的归一化常Q倒谱特征的回放语音检测方法，其特征在于，步骤S3中，将归一化的CQCC系数置于混合高斯模型中进行训练得到语音模型，还包括使用混合高斯模型进行加权参数优化，并使用期望最大化算法进行话和高斯模型估计。4.根据权利要求3所述的归一化常Q倒谱特征的回放语音检测方法，其特征在于，步骤S1中，提取所述语音信息X(n)的CQCC系数包括：S1.1：对语音信息X(n)进行常Q变化(CQT)，公式为其中，k＝1,2,…，K为序列CQ谱的频域下标，Nk为窗口长度，基函数ak*(n...

【专利技术属性】
技术研发人员：劳灵杰，叶勇超，严迪群，林朗，
申请(专利权)人：宁波大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人