语音情感识别方法、装置、设备及存储介质制造方法及图纸

技术编号：23673448 阅读：24 留言：0更新日期：2020-04-04 18:40

本发明专利技术属于语音信号处理和模式识别技术领域，公开了一种语音情感识别方法、装置、设备及存储介质。该方法包括：获取预设维度的测试语音样本，并通过预设规则对测试语音样本进行分段处理，获得多个初始语音样本；对初始语音样本进行信号特征数据提取，获得待处理语音信号特征数据；通过预设统计函数对待处理语音信号特征数据进行特征统计，获得待确认特征统计结果；根据待确认特征统计结果，通过预设多目标优化算法获得特征目标数据；将特征目标数据输入至预设Softmax分类模型中，获得语音情感识别结果。通过上述方式，将语音情感片段形成语音情感数据，并输入至预设Softmax分类模型中，从而能够更好地识别语音情感。

Speech emotion recognition method, device, equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
语音情感识别方法、装置、设备及存储介质
本专利技术涉及语音信号处理和模式识别
，尤其涉及一种语音情感识别方法、装置、设备及存储介质。
技术介绍
目前有较多种语音情感识别方法，但是这些方法没有注意到人类的语音情感表达具有短时性和局部性。比如语音情感识别中，前半句、一个词愤怒就可认为整句话愤怒。会出现以下几个问题：一、使用整句话识别情感，经常会稀释情感的特征变化。比如，“我们明天去北京，你觉得可行吗？”，这句话往往后半句才体现较大的情感差别。导致在深度学习中使用针对时间的均值池化、卷积和针对所有特征的全连接层会稀释情感的特征变化；二、局部组合成句子时，经常会中和情感的特征变化。众所周知，汉语语调有一至四声，其中二声和四声在时间变化上的特点完全相反。导致在深度学习中使用针对时间的均值池化，针对时间序列的注意层等均会中和情感的特征变化；三、组成情感的字词在语句中的位置不固定，会造成同情感的特征差异很大。比如，“这样可行吗？”和“可行吗？这样！”表达了相同意思，但是现有卷积神经网络，输出的特征却完全不同。上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种语音情感识别方法、装置、设备及存储介质，旨在解决如何准确语音情感的技术问题。为实现上述目的，本专利技术提供了一种语音情感识别方法，所述方法包括以下步骤:获取预设维度的测试语音样本，并通过预设规则对所述测试语音样本进行分段处理，获得多个初始语音样本；...

【技术保护点】
1.一种语音情感识别方法，其特征在于，所述方法包括：/n获取预设维度的测试语音样本，并通过预设规则对所述测试语音样本进行分段处理，获得多个初始语音样本；/n对所述初始语音样本进行信号特征数据提取，获得待处理语音信号特征数据；/n通过预设统计函数对所述待处理语音信号特征数据进行特征统计，获得待确认特征统计结果；/n根据所述待确认特征统计结果，通过预设多目标优化算法获得特征目标数据；/n将所述特征目标数据输入至预设Softmax分类模型中，获得语音情感识别结果。/n

【技术特征摘要】
1.一种语音情感识别方法，其特征在于，所述方法包括：
获取预设维度的测试语音样本，并通过预设规则对所述测试语音样本进行分段处理，获得多个初始语音样本；
对所述初始语音样本进行信号特征数据提取，获得待处理语音信号特征数据；
通过预设统计函数对所述待处理语音信号特征数据进行特征统计，获得待确认特征统计结果；
根据所述待确认特征统计结果，通过预设多目标优化算法获得特征目标数据；
将所述特征目标数据输入至预设Softmax分类模型中，获得语音情感识别结果。

2.如权利要求1所述的方法，其特征在于，所述获取预设维度的测试语音样本，并通过预设规则对所述测试语音样本进行分段处理，获得多个初始语音样本的步骤之前，还包括：
获取预设维度的训练语音样本，并通过预设规则对所述测试语音样本进行分段处理，获得多个初始训练语音样本；
对所述初始训练语音样本进行特征提取，获得待处理训练语音信号特征；
通过预设统计函数对所述待处理训练语音信号特征进行特征统计，获取待确认训练特征统计结果；
根据所述待确认训练特征统计结果，通过预设多目标优化算法获得目标训练特征数据；
根据所述目标训练特征数据获取所述目标训练特征数据对应的情感类别；
根据所述情感类别和所述情感类别对应的目标训练特征数据建立预设Softmax分类模型。

3.如权利要求2所述的方法，其特征在于，所述根据所述待确认训练特征统计结果，通过预设多目标优化算法获得目标训练特征数据的步骤，包括：
对所述待确认训练特征统计结果进行情感类别划分，获得不同情感类别对应的待优化训练特征数据；
根据所述待优化训练特征数据，通过预设多目标优化算法获得目标训练特征数据。

4.如权利要求2所述的方法，其特征在于，所述将所述特征目标数据输入至预设Softmax分类模型中，获得语音情感识别结果的步骤，包括：
将所述特征目标数据输入至所述预设Softmax分类模型中，获得语音情感类别数据；
对所述语音情感类别数据进行数据统计，获得语音情感类别数据值；
根据所述语音情感类别数据值获得语音情感识别结果。

【专利技术属性】
技术研发人员：孙亚新，叶青，
申请(专利权)人：湖北文理学院，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人