一种基于情感GMM模型权重合成的情感说话人识别方法技术

技术编号：9463625 阅读：134 留言：0更新日期：2013-12-19 01:20

本发明专利技术公开了一种基于情感GMM模型权重合成的情感说话人识别方法，步骤如下：（1）针对每个说话人，建立说话人的中性GMM模型，并依据对应的中性情感权重参数变换模型，得到不同的情感GMM模型；（2）采集待识别说话人的语音并提取语音特征，将得到的语音特征在步骤（1）中得到的所有情感GMM模型中进行得分计算；（3）将所有得分进行比较，得分最高的情感GMM模型所对应的说话人即为待识别说话人。本发明专利技术基于情感GMM模型权重合成的情感说话人识别方法，通过建立说话人的中性情感权重模型，在仅仅采集说话人中性语音的基础上，提高对说话人情感变化识别的鲁棒性，提高说话人识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于情感GMM模型权重合成的情感说话人识别方法，步骤如下：（1）针对每个说话人，建立说话人的中性GMM模型，并依据对应的中性情感权重参数变换模型，得到不同的情感GMM模型；（2）采集待识别说话人的语音并提取语音特征，将得到的语音特征在步骤（1）中得到的所有情感GMM模型中进行得分计算；（3）将所有得分进行比较，得分最高的情感GMM模型所对应的说话人即为待识别说话人。本专利技术基于情感GMM模型权重合成的情感说话人识别方法，通过建立说话人的中性情感权重模型，在仅仅采集说话人中性语音的基础上，提高对说话人情感变化识别的鲁棒性，提高说话人识别的准确性。【专利说明】一种基于情感G圖模型权重合成的情感说话人识别方法
本专利技术涉及信号处理和模式识别，更具体地，本专利技术涉及一种基于情感GMM模型权重合成的情感说话人识别方法。
技术介绍
说话人识别技术是指利用信号处理技术和模式识别方法，通过采集说话人的语音来识别其身份的技术，主要包括两个步骤:说话人模型训练和测试语音识别。情感说话人识别是为了解决注册说话人的训练语音和测试语音存在情感不一致引起的说话人识别系统性能下降问题。本专利提出的方法就是通过建立说话人的虚拟情感模型，提高系统的识别性能。目前，说话人识别采用的主要短时语音特征包括梅尔倒谱系数(MFCC)，线性预测编码倒谱系数(LPCC)，感觉加权的线性预测系数(PLP)。说话人识别的算法主要包括矢量量化(VQ)，通用背景模型方法(GMM-UBM)，支持向量机(SVM)等等。其中，GMM-UBM在整个说话人识别领域应用非常广泛...

【技术保护点】
一种基于情感GMM模型权重合成的情感说话人识别方法，其特征在于，步骤如下：（1）针对每个说话人，建立说话人的中性GMM模型，并依据对应的中性情感权重参数变换模型，得到不同的情感GMM模型；（2）采集待识别说话人的语音并提取语音特征，将得到的语音特征在步骤（1）中得到的所有情感GMM模型中进行得分计算；（3）将所有得分进行比较，得分最高的情感GMM模型所对应的说话人即为待识别说话人。

【技术特征摘要】

【专利技术属性】
技术研发人员：杨莹春，陈力，吴朝晖，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人