一种语音情绪识别方法、装置、设备及存储介质制造方法及图纸

技术编号：25402101 阅读：56 留言：0更新日期：2020-08-25 23:06

本发明专利技术公开了一种语音情绪识别方法、装置、设备及存储介质，该方法包括：获取语音数据；对语音数据进行信息提取，获取统计学特征和时间序列特征；将统计学特征和时间序列特征作为输入参数，输入至结构化递归神经网络模型中，输出得到语音情绪种类。该方法实现提升识别效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音情绪识别方法、装置、设备及存储介质
本专利技术涉及计算机
，特别是涉及一种语音情绪识别方法、装置、设备及存储介质。
技术介绍
目前，在人机交互过程中，计算机是否可以体会并理解人的喜怒哀乐具有非常重要的意义。这可以帮助我们在特定场景中赋予计算机像人类一样的观察、理解能力。语音信息是人类表达情绪更加直接的方式。声调的起伏，响度的高低或是说话的快慢，这些信息中都包含了大量的作为判断情绪的特征。传统处理声学信息的方法，往往是通过语音转文字，再对其文本进行情绪分析这样将其转换为自然语言NLP领域的情绪识别方法。但是这样的情绪识别方法需要进行语音转换文本的过程，过程繁琐，导致更加繁重的资源消耗，效率较低。因此，如何提升识别效率是亟待解决的问题。
技术实现思路
本专利技术的目的是提供一种语音情绪识别方法、装置、设备及存储介质，以实现提升识别效率。为解决上述技术问题，本专利技术提供一种语音情绪识别方法，包括：获取语音数据；对语音数据进行信息提取，获取统计学特征和时间序列特征；将统计学特征和时间序列特征作为输入参数，输入至结构化递归神经网络模型中，输出得到语音情绪种类。优选的，所述获取语音数据之前，还包括：构建结构化递归神经网络模型。优选的，所述构建结构化递归神经网络模型，包括：获取语音训练数据集，对语音训练数据集进行信息提取，获取语音训练数据集的统计学特征和时间序列特征采用Bi-GRU神经网络对统计学特征时间序列特征进行...

【技术保护点】
1.一种语音情绪识别方法，其特征在于，包括：/n获取语音数据；/n对语音数据进行信息提取，获取统计学特征和时间序列特征；/n将统计学特征和时间序列特征作为输入参数，输入至结构化递归神经网络模型中，输出得到语音情绪种类。/n

【技术特征摘要】
1.一种语音情绪识别方法，其特征在于，包括：
获取语音数据；
对语音数据进行信息提取，获取统计学特征和时间序列特征；
将统计学特征和时间序列特征作为输入参数，输入至结构化递归神经网络模型中，输出得到语音情绪种类。

2.如权利要求1所述的方法，其特征在于，所述获取语音数据之前，还包括：
构建结构化递归神经网络模型。

3.如权利要求2所述的方法，其特征在于，所述构建结构化递归神经网络模型，包括：
获取语音训练数据集，对语音训练数据集进行信息提取，获取语音训练数据集的统计学特征和时间序列特征
采用Bi-GRU神经网络对统计学特征时间序列特征进行训练学习，得到结构化递归神经网络模型。

4.如权利要求3所述的方法，其特征在于，所述采用Bi-GRU神经网络对统计学特征时间序列特征进行训练学习，得到结构化递归神经网络模型，包括：
对时间序列特征进行帧级处理，得到话语级嵌入向量uemb；
对统计学特征进行非线性变换得到高阶统计学特征uop；
利用话语级嵌入向量uemb、高阶统计学特征uop进行融合处理，得到融合特征uF；
对融合特征uF进行话语级处理，得到声学情绪特征Aj；
利用声学情绪特征Aj计算交叉熵损失loss；
以交叉熵损失loss为目标函数，对统计学特征时间序列特征进行训练学习，当loss的数值不再降低时，终止训练学习，将最后训练得到的神经网络模型作为结构化递归神...

【专利技术属性】
技术研发人员：李净，
申请(专利权)人：北京慧闻科技集团有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人