一种情感语音PAD值预测方法及系统技术方案

技术编号:19429896 阅读:30 留言:0更新日期:2018-11-14 11:30
本发明专利技术公开了一种情感语音PAD值预测方法及系统。该方法包括:获取测试情感语音数据;对所述测试情感语音数据进行特征提取,得到测试特征数据;获取训练好的支持向量回归模型;通过所述训练好的支持向量回归模型对所述测试特征数据进行预测,得到所述测试情感语音数据的PAD值。本方法或系统能够快速、准确的预测情感语音的PAD值。

【技术实现步骤摘要】
一种情感语音PAD值预测方法及系统
本专利技术涉及情感语音PAD值预测领域,特别是涉及一种情感语音PAD值预测方法及系统。
技术介绍
语音是人类沟通最有效的方式,在人机交互应用中得到了越来越广泛的应用。语音中不仅包含了文字信息,同时还包含丰富的能反映说话人情感状态的信息。语音情感识别是通过计算机对说话人的情感类型进行认知判断,目前大多数的语音情感识别研究集中在基本的离散情感,例如识别语音的情感是愤怒还是高兴。但在现实生活中,人们的情感通常是连续的、复杂多变的,比如喜极而泣、悲喜交加等情感已经不再完全属于某一特定的离散情感类别。基于这种情况,研究人员提出维度理论,采用维度空间来表示复杂变化的情感类别,即情感可被表示为多维情感空间中的一个坐标点。维度情感语音对于实现人机交互及开展情感计算的研究提供了更充分的基础。近几年,维度情感语音研究逐渐得到了广泛的关注。目前,维度坐标主要是根据情感量表人工标注得到,这种方法耗时长,易受主观影响。
技术实现思路
本专利技术的目的是提供一种情感语音PAD值预测方法及系统,用以快速、准确的预测情感语音的PAD值。为实现上述目的,本专利技术提供了如下方案:一种情感语音PAD值预测方法,所述方法包括:获取测试情感语音数据;对所述测试情感语音数据进行特征提取,得到测试特征数据;获取训练好的支持向量回归模型;通过所述训练好的支持向量回归模型对所述测试特征数据进行预测,得到所述测试情感语音数据的PAD值。可选的,在所述获取测试情感语音数据,之前还包括:获取训练情感语音数据;通过PAD三维情感量表对所述训练情感语音数据进行标注,得到标注PAD值;对所述训练情感语音数据进行特征提取,得到训练特征数据;通过所述训练特征数据以及所述标注PAD值对支持向量回归模型进行训练,得到训练好的支持向量回归模型。可选的,所述通过所述训练特征数据以及所述标注PAD值对支持向量回归模型进行训练,得到训练好的支持向量回归模型,具体包括:将所述训练特征数据输入到所述支持向量回归模型中,得到输出数据;判断所述输出数据与所述标注PAD值的误差是否在误差阈值范围内;若是,得到训练好的支持向量回归模型;若否,调整所述支持向量回归模型的参数,使所述输出数据与所述标注PAD值的误差在误差阈值范围内,得到训练好的支持向量回归模型。可选的,所述调整所述支持向量回归模型的参数,具体包括:通过交叉网格搜索法对所述支持向量回归模型的惩罚因子以及核函数进行调整。一种情感语音PAD值预测系统,所述系统包括:测试情感语音数据获取模块,用于获取测试情感语音数据;测试特征数据提取模块,用于对所述测试情感语音数据进行特征提取,得到测试特征数据;支持向量回归模型获取模块,用于获取训练好的支持向量回归模型;预测模块,用于通过所述训练好的支持向量回归模型对所述测试特征数据进行预测,得到所述测试情感语音数据的PAD值。可选的,所述系统还包括:训练情感语音数据获取模块,用于获取训练情感语音数据;标注模块,用于通过PAD三维情感量表对所述训练情感语音数据进行标注,得到标注PAD值;训练特征数据提取模块,用于对所述训练情感语音数据进行特征提取,得到训练特征数据;训练模块,用于通过所述训练特征数据以及所述标注PAD值对支持向量回归模型进行训练,得到训练好的支持向量回归模型。可选的,所述训练模块具体包括:输入单元,用于将所述训练特征数据输入到所述支持向量回归模型中,得到输出数据;判断单元,用于判断所述输出数据与所述标注PAD值的误差是否在误差阈值范围内;结果确定单元,用于当所述输出数据与所述标注PAD值的误差在误差阈值范围内时,得到训练好的支持向量回归模型;调整单元,用于当所述输出数据与所述标注PAD值的误差不在误差阈值范围内时,调整所述支持向量回归模型的参数,使所述输出数据与所述标注PAD值的误差在误差阈值范围内,得到训练好的支持向量回归模型。可选的,所述调整单元通过交叉网格搜索法对所述支持向量回归模型的惩罚因子以及核函数进行调整。与现有技术相比,本专利技术具有以下技术效果:本专利技术通过训练好的支持向量回归模型对对维度情感语音的PAD进行预测,预测精度方面得到提高,实现了对情感语音PAD值较为准确的预测。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例情感语音PAD值预测方法的流程图;图2为本专利技术实施例情感语音PAD值预测系统的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图1为本专利技术实施例情感语音PAD值预测方法的流程图。如图1所示,一种情感语音PAD值预测包括以下步骤:步骤101:获取测试情感语音数据。步骤102:对所述测试情感语音数据进行特征提取,得到测试特征数据。步骤103:获取训练好的支持向量回归模型。步骤104:通过所述训练好的支持向量回归模型对所述测试特征数据进行预测,得到所述测试情感语音数据的PAD值,P为愉悦度,表示个体情感状态的正负特性;A为激活度,表示个体的神经生理激活程度;D为优势度,表示个体对情境和他人的控制状态。在所述获取测试情感语音数据,之前还包括:获取训练情感语音数据;通过PAD三维情感量表对所述训练情感语音数据进行标注,得到标注PAD值;对所述训练情感语音数据进行特征提取,得到训练特征数据;通过所述训练特征数据以及所述标注PAD值对支持向量回归模型进行训练,得到训练好的支持向量回归模型。将所述训练特征数据输入到所述支持向量回归模型中,得到输出数据;判断所述输出数据与所述标注PAD值的误差是否在误差阈值范围内;若是,得到训练好的支持向量回归模型;若否,通过交叉网格搜索法对所述支持向量回归模型的惩罚因子以及核函数进行调整,使所述输出数据与所述标注PAD值的误差在误差阈值范围内,得到训练好的支持向量回归模型。具体实施:根据中科院制定的PAD三维情感量表和自我评定模型,在实验室原有的离散情感语音数据库TYUT2.0的基础上,招募100名在校大学生根据评定模型对每句情感语音的P、A、D维度进行打分标注,得到标注数据后对数据进行有效性验证,建立维度情感语音数据库,为后续对SVR回归模型的训练以及预测性能评估提供比较数据。提取情感语音的语速、过零率、短时能量、基音频率、共振峰和MFCC特征,具体为:平均语速;平均过零率;能量及其1阶差分的最大值、最小值、均值;基频及其1阶差分的最大值、最小值、均值;第1共振峰(F1)及其1阶差分的最大值、最小值、均值、方差;第2共振峰(F2)及其1阶差分的最大值、最小值、均值、方差;第3共振峰(F3)及其1阶差分的最大值、最小值、均值、方差;MFCCs是MFCC本文档来自技高网...

【技术保护点】
1.一种情感语音PAD值预测方法,其特征在于,所述方法包括:获取测试情感语音数据;对所述测试情感语音数据进行特征提取,得到测试特征数据;获取训练好的支持向量回归模型;通过所述训练好的支持向量回归模型对所述测试特征数据进行预测,得到所述测试情感语音数据的PAD值。

【技术特征摘要】
1.一种情感语音PAD值预测方法,其特征在于,所述方法包括:获取测试情感语音数据;对所述测试情感语音数据进行特征提取,得到测试特征数据;获取训练好的支持向量回归模型;通过所述训练好的支持向量回归模型对所述测试特征数据进行预测,得到所述测试情感语音数据的PAD值。2.根据权利要求1所述的情感语音PAD值预测方法,其特征在于,在所述获取测试情感语音数据,之前还包括:获取训练情感语音数据;通过PAD三维情感量表对所述训练情感语音数据进行标注,得到标注PAD值;对所述训练情感语音数据进行特征提取,得到训练特征数据;通过所述训练特征数据以及所述标注PAD值对支持向量回归模型进行训练,得到训练好的支持向量回归模型。3.根据权利要求2所述的情感语音PAD值预测方法,其特征在于,所述通过所述训练特征数据以及所述标注PAD值对支持向量回归模型进行训练,得到训练好的支持向量回归模型,具体包括:将所述训练特征数据输入到所述支持向量回归模型中,得到输出数据;判断所述输出数据与所述标注PAD值的误差是否在误差阈值范围内;若是,得到训练好的支持向量回归模型;若否,调整所述支持向量回归模型的参数,使所述输出数据与所述标注PAD值的误差在误差阈值范围内,得到训练好的支持向量回归模型。4.根据权利要求3所述的情感语音PAD值预测方法,其特征在于,所述调整所述支持向量回归模型的参数,具体包括:通过交叉网格搜索法对所述支持向量回归模型的惩罚因子以及核函数进行调整。5.一种情感语音PAD值预测系统,其特征在于,所述系统包括:测试情感语音数据获取模块,用于获取测试情...

【专利技术属性】
技术研发人员:张雪英孙颖张卫张婷黄丽霞陈桂军
申请(专利权)人:太原理工大学
类型:发明
国别省市:山西,14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1