基于多类型组合特征参数的声纹识别方法技术

技术编号：11870582 阅读：94 留言：0更新日期：2015-08-12 20:53

本发明专利技术提供了一种基于多类型组合特征参数的声纹识别方法，包括以下步骤：语音信号的采集输入、语音信号预处理、语音信号组合特征参数提取：即提取MFCC、LPCC、ΔMFCC、ΔLPCC、能量、能量的一阶差分、GFCC特征参数共同组成多维特征向量、采用遗传算法对多维特征参数进行筛选、引入通用背景模型UBM训练得到说话人的声音模型、最后利用GMM-UBM模型对测试语音进行识别。与单一的语音信号特征参数进行声纹识别相比，采用组合特征参数并使用GMM-UBM模型的声纹识别系统，有效地提高了声纹识别的识别准确率和系统稳定性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音信号处理领域，具体涉及一种基于多类型组合特征参数的声纹识别方法。
技术介绍
在当今信息时代的前提下，作为信息安全的重要组成部分之一的身份识别技术引来了新的挑战。传统的密码识别由于算法的局限性与硬软件解密技术的上升已经展现出了它的弊端。作为身份识别的新技术之一，声纹识别技术，因其独特的方便性、经济性及准确性等优点，受到人们越来越多的重视。声纹识别，就是从说话人的一段语音中提取出说话人的个性特征，通过对个人特征的分析与识别，从而达到对说话人进行辨认或者确认的目的。说话人识别并不注意语音信号的内容，而是希望从语音信号中提取个人的特征，由于每个人独特的声道特性和发音特点，使得说话人的语音信号具有区别于其他说话人的特征，这就是声纹识别的基本依据。声纹识别的关键技术，主要是语音信号的特征参数提取和识别模型的建立。最常用的语音信号的特征参数有两种：一种是根据人耳对不同频率的语音信号的敏感程度提取的梅尔频率倒谱系数（MFCC)，反映了说话人语音的听觉频率的非线性特性，在噪声中环境中能体现优势；另一种是根据语音信号的全极点模型得到的线性预测倒谱系数（LPCC)，反映了说话人声道的生理结构差异。MFCC分析着眼于人耳的听觉特性，MEL频率尺度更符合人耳的听觉特性，能很好的反映语音的特性。LPCC特征参数提取，是基于语音信号为自回归信号的假设，利用线性预测分析从而获得倒谱参数。LPCC参数的最大优点是它能够极为精确地估计语音参数，用很少的参数有效而又正确地表现语音波形机器频谱的性质，而且计算效率高，且对元音有较好...

【技术保护点】
一种基于多类型组合特征参数的声纹识别方法，其特征在于，包括如下步骤：S1：语音信号的采集输入；S2：语音信号的预处理，主要包括预加重、分帧和加窗处理；S3：语音信号组合特征参数提取：提取MFCC、LPCC、△MFCC、△LPCC、能量、能量的一阶差分以及GFCC特征参数共同组成多维特征向量，其中：MFCC为梅尔频率倒谱系数，LPCC为线性预测倒谱系数，△MFCC为MFCC的一阶差分，△LPCC为LPCC的一阶差分，GFCC为Gammatone滤波器倒谱系数；S4：利用遗传算法对步骤S3中的多维特征向量进行筛选，将GMM‑UBM识别过程中等错误率作为评价函数，选取使得等错误率最小的特征向量作为声纹识别的特征向量，其中所述GMM‑UBM为高斯混合模型与通用背景模型相结合的说话人识别模型；S5：使用GMM‑UBM训练得到说话人的声音模型，即将语音库随机选取相应数量的语音训练得到UBM，然后利用最大后验准则自适应得到不同说话人的声音模型；S6：提取经遗传算法筛选后的测试语音的特征参数，利用步骤S5训练得到的GMM‑UBM模型，计算出对数概率得分，选择概率得分最大者，即为目标说话人。

【技术特征摘要】

【专利技术属性】
技术研发人员：李勇明，谢文宾，王品，刘玉川，徐莎，
申请(专利权)人：重庆大学，
类型：发明
国别省市：重庆;85

全部详细技术资料下载我是这个专利的主人