一种建立语音情感识别模型的方法及语音情感识别方法技术

技术编号：23559971 阅读：22 留言：0更新日期：2020-03-25 05:07

本发明专利技术公开了一种建立语音情感识别模型的方法，所述方法包括：使用opensmile提取出1584维的情感声学特征；利用情感声学特征作为自然情绪状态的语音训练生成一个UBM通用背景模型；针对每一类自然情绪状态，在UBM通用背景模型的基础上生成每一类自然情绪状态对应的GMM模型；将生成的每一类自然情绪状态对应的GMM模型作为语音情感识别模型。

A method of building speech emotion recognition model and speech emotion recognition method

全部详细技术资料下载

【技术实现步骤摘要】
一种建立语音情感识别模型的方法及语音情感识别方法
本专利技术涉及语音信号处理领域，尤其涉及一种建立语音情感识别模型的方法及语音情感识别方法。
技术介绍
随着人工智能技术的发展，计算机变得越来越智能，小爱同学、苹果siri以及更多的智能对话系统走进人们的生活，人们通过智能对话系统与各种各样的机器进行交流互动，但是几乎所有的智能对话系统都无法能够对人的情感进行识别，作出足够智能的反馈。语音中的情绪信息是反应人类情绪的一个十分重要的行为信号，同时识别语音中所包含的情绪信息是实现自然人机交互的重要一环。而目前的人脸识别技术，可以通过对人类的表情进行判断分析，却无法适用于智能外呼场景，在目前的智能外呼领域中情绪识别还是一个比较空白的领域。
技术实现思路
本专利技术要解决的技术问题，在于提供一种建立语音情感识别模型的方法及语音情感识别方法，以实现智能外呼领域识别语音所携带的情绪，提高语义的理解精度。第一方面，本专利技术提供一种建立语音情感识别模型的方法，所述方法包括：使用opensmile提取出1584维的情感声学特征；利用所述情感声学特征作为自然情绪状态的语音训练生成一个UBM通用背景模型；针对每一类自然情绪状态，在所述UBM通用背景模型的基础上生成每一类自然情绪状态对应的GMM模型；将所述生成的每一类自然情绪状态对应的GMM模型作为语音情感识别模型。在上述方案中，所述自然情绪状态包括高兴、悲伤、愤怒和中性。第二方面，本专利技术提供一种基于第一方面任一...

【技术保护点】
1.一种建立语音情感识别模型的方法，其特征是，所述方法包括：/n使用opensmile提取出1584维的情感声学特征；/n利用所述情感声学特征作为自然情绪状态的语音训练生成一个UBM通用背景模型；/n针对每一类自然情绪状态，在所述UBM通用背景模型的基础上生成每一类自然情绪状态对应的GMM模型；/n将所述自适应生成的每一类自然情绪状态对应的GMM模型作为语音情感识别模型。/n

【技术特征摘要】
1.一种建立语音情感识别模型的方法，其特征是，所述方法包括：
使用opensmile提取出1584维的情感声学特征；
利用所述情感声学特征作为自然情绪状态的语音训练生成一个UBM通用背景模型；
针对每一类自然情绪状态，在所述UBM通用背景模型的基础上生成每一类自然情绪状态对应的GMM模型；
将所述自适应生成的每一类自然情绪状态对应的GMM模型作为语音情感识别模型。

2.根据权利要求1所述的一种基于GMM-UBM建立语音情感识别模型的方法，其特征是，所述自然情绪状态包括高兴、悲伤、愤怒和中性。

3.一种基于上述权利要求1-2任一项所述一种建立语音情感识别模型的方法的语音情感识别方法，...

【专利技术属性】
技术研发人员：王磊，
申请(专利权)人：浙江百应科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人