一种情感语音PAD值预测方法及系统技术方案

技术编号：19429896 阅读：30 留言：0更新日期：2018-11-14 11:30

本发明专利技术公开了一种情感语音PAD值预测方法及系统。该方法包括：获取测试情感语音数据；对所述测试情感语音数据进行特征提取，得到测试特征数据；获取训练好的支持向量回归模型；通过所述训练好的支持向量回归模型对所述测试特征数据进行预测，得到所述测试情感语音数据的PAD值。本方法或系统能够快速、准确的预测情感语音的PAD值。

全部详细技术资料下载

【技术实现步骤摘要】
一种情感语音PAD值预测方法及系统
本专利技术涉及情感语音PAD值预测领域，特别是涉及一种情感语音PAD值预测方法及系统。
技术介绍
语音是人类沟通最有效的方式，在人机交互应用中得到了越来越广泛的应用。语音中不仅包含了文字信息，同时还包含丰富的能反映说话人情感状态的信息。语音情感识别是通过计算机对说话人的情感类型进行认知判断，目前大多数的语音情感识别研究集中在基本的离散情感，例如识别语音的情感是愤怒还是高兴。但在现实生活中，人们的情感通常是连续的、复杂多变的，比如喜极而泣、悲喜交加等情感已经不再完全属于某一特定的离散情感类别。基于这种情况，研究人员提出维度理论，采用维度空间来表示复杂变化的情感类别，即情感可被表示为多维情感空间中的一个坐标点。维度情感语音对于实现人机交互及开展情感计算的研究提供了更充分的基础。近几年，维度情感语音研究逐渐得到了广泛的关注。目前，维度坐标主要是根据情感量表人工标注得到，这种方法耗时长，易受主观影响。
技术实现思路
本专利技术的目的是提供一种情感语音PAD值预测方法及系统，用以快速、准确的预测情感语音的PAD值。为实现上述目的，本专利技术提供了如下方案：一种情感语音PAD值预测方法，所述方法包括：获取测试情感语音数据；对所述测试情感语音数据进行特征提取，得到测试特征数据；获取训练好的支持向量回归模型；通过所述训练好的支持向量回归模型对所述测试特征数据进行预测，得到所述测试情感语音数据的PAD值。可选的，在所述获取测试情感语音数据，之前还包括：获取训练情感语音数据；通过PAD三维情感量表对所述训练情感语音数据进行标注，得到标注PAD值...

【技术保护点】
1.一种情感语音PAD值预测方法，其特征在于，所述方法包括：获取测试情感语音数据；对所述测试情感语音数据进行特征提取，得到测试特征数据；获取训练好的支持向量回归模型；通过所述训练好的支持向量回归模型对所述测试特征数据进行预测，得到所述测试情感语音数据的PAD值。

【技术特征摘要】
1.一种情感语音PAD值预测方法，其特征在于，所述方法包括：获取测试情感语音数据；对所述测试情感语音数据进行特征提取，得到测试特征数据；获取训练好的支持向量回归模型；通过所述训练好的支持向量回归模型对所述测试特征数据进行预测，得到所述测试情感语音数据的PAD值。2.根据权利要求1所述的情感语音PAD值预测方法，其特征在于，在所述获取测试情感语音数据，之前还包括：获取训练情感语音数据；通过PAD三维情感量表对所述训练情感语音数据进行标注，得到标注PAD值；对所述训练情感语音数据进行特征提取，得到训练特征数据；通过所述训练特征数据以及所述标注PAD值对支持向量回归模型进行训练，得到训练好的支持向量回归模型。3.根据权利要求2所述的情感语音PAD值预测方法，其特征在于，所述通过所述训练特征数据以及所述标注PAD值对支持向量回归模型进行训练，得到训练好的支持向量回归模型，具体包括：将所述训练特征数据输入到所述支持向量回归模型中，得到输出数据；判断所述输出数据与所述标注PAD值的误差是否在误差阈值范围内；若是，得到训练好的支持向量回归模型；若否，调整所述支持向量回归模型的参数，使所述输出数据与所述标注PAD值的误差在误差阈值范围内，得到训练好的支持向量回归模型。4.根据权利要求3所述的情感语音PAD值预测方法，其特征在于，所述调整所述支持向量回归模型的参数，具体包括：通过交叉网格搜索法对所述支持向量回归模型的惩罚因子以及核函数进行调整。5.一种情感语音PAD值预测系统，其特征在于，所述系统包括：测试情感语音数据获取模块，用于获取测试情...

【专利技术属性】
技术研发人员：张雪英，孙颖，张卫，张婷，黄丽霞，陈桂军，
申请(专利权)人：太原理工大学，
类型：发明
国别省市：山西,14

全部详细技术资料下载我是这个专利的主人