一种半监督语音特征可变因素分解方法技术

技术编号：10398311 阅读：128 留言：0更新日期：2014-09-07 19:24

本发明专利技术公开了一种半监督语音特征可变因素分解方法，把语音特征分成四类：情感相关特征、性别相关特征、年龄相关特征、包括噪声和语种的其他因素相关特征。首先，对语音进行预处理得到语谱图，不同尺寸的语谱块输入无监督特征学习网络SAE，预训练得到不同尺寸的卷积核，然后分别用不同尺寸的卷积核对整个语谱图进行卷积，得到若干特征映射图，再对特征映射图进行最大池化，最终把特征堆叠起来形成局部不变特征y。y作为半监督卷积神经网络的输入，通过最小化四个不同的损失函数项将y分解成四类特征。本发明专利技术解决了情感、性别、年龄语音特征相互混杂导致识别准确率不高的问题，可分别用于基于语音信号的不同识别需求，还可以用于分解更多因素。

全部详细技术资料下载

【技术实现步骤摘要】
一种半监督语音特征可变因素分解方法
本专利技术属于语音识别领域，具体涉及一种语音特征分解的方法。
技术介绍
随着计算机渗透到生活的各个角落，各种类型的计算平台都需要更简便的输入媒体，语音当仁不让成为用户最佳的选择之一。一般来说，语音中包括了说话人、说话内容、说话人的情感、性别、年龄等多种信息。近年来，随着一些应用的不断完善，促进了对人的情感、性别、年龄、说话内容等方面的基于语音信号的识别技术的发展。比如传统的呼叫中心通常都会随机的接通服务生来为客户提供电话咨询，而不能够根据用户的情感、性别和年龄提供个性化的服务，这就促使了是否可以通过客户的声音来判断其情感、性别和年龄，并以此为依据提供更加个性化的语音服务。但是在现有的基于语音信号的情感、性别和年龄识别相关任务中，传统的特征提取方法所提取的特征往往掺杂了情感、性别、年龄、说话内容、语言等因素，彼此之间很难区分，从而导致识别效果不佳。在DongYu等、名称为FeatureLearninginDeepNeuralNetworks—StudiesonSpeechRecognitionTasks的论文中，利用深度神经网络学到一个深层特征，但这个特征可能混杂了很多因素，如情感、性别、年龄等因素，如果把这个特征用于语音情感识别，识别率可能会受特征中其他因素的影响。目前还未出现一种特征提取方法能分别提取语音信号中不同类型的特征。本专利技术为了克服现有技术的缺陷，通过基于卷积神经网络的半监督特征学习，将语音特征分解成四类：情感相关特征、性别相关特征、年龄相关特征、其他因素相关特征，可分别用于基于语音信号的不同识别需求。本专...
一种半监督语音特征可变因素分解方法

【技术保护点】
一种半监督语音特征可变因素分解方法，其特征在于包括下列步骤：步骤一，预处理：对语音样本进行预处理得到语谱图，再采用PCA进行主成份分析降维以及白化，从中提取出不同尺寸的语谱块；步骤二，无监督的局部不变特征学习：将所述语谱块作为无监督特征学习SAE的输入，通过输入不同尺寸的语谱块，预训练得到不同尺寸的卷积核，然后分别用所述不同尺寸的卷积核对整个语谱图进行卷积，得到若干特征映射图，再对所述特征映射图进行最大池化，最终把特征堆叠起来形成局部不变特征y；步骤三，基于卷积神经网络的半监督特征学习：将所述局部不变特征y作为半监督学习算法的输入，利用基于卷积神经网络的半监督学习的方法，通过四个不同的损失函数将将局部不变特征y分解成四类特征；所述四类特征包括情感相关特征、性别相关特征、年龄相关特征、以及包括噪声和语种的其他因素相关特征；所述半监督学习的损失函数由重构误差函数、判别损失函数、正交损失函数、显著性损失函数四部分组成；对于所述重构误差函数，所述四类特征都要参与重构局部不变特征y，误差采用均方误差；对于所述判别损失函数，先对有标签的数据进行类别预测，然后计算预测标签和真实标签之间的差异作为...

【技术特征摘要】
1.一种半监督语音特征可变因素分解方法，其特征在于包括下列步骤：步骤一，预处理：对语音样本进行预处理得到语谱图，再采用PCA进行主成份分析降维以及白化，从中提取出不同尺寸的语谱块；步骤二，无监督的局部不变特征学习：将所述语谱块作为无监督特征学习SAE的输入，通过输入不同尺寸的语谱块，预训练得到不同尺寸的卷积核，然后分别用所述不同尺寸的卷积核对整个语谱图进行卷积，得到若干特征映射图，再对所述特征映射图进行最大池化，最终把特征堆叠起来形成局部不变特征y；步骤三，基于卷积神经网络的半监督特征学习：将所述局部不变特征y作为半监督学习算法的输入，利用基于卷积神经网络的半监督学习的方法，通过四个不同的损失函数将局部不变特征y分解成四类特征；所述四类特征包括情感相关特...

【专利技术属性】
技术研发人员：毛启容，黄正伟，薛文韬，于永斌，詹永照，苟建平，邢玉萍，
申请(专利权)人：江苏大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人