基于HMM/SOFMNN混合模型的语音情感识别方法技术

技术编号：8241781 阅读：301 留言：0更新日期：2013-01-24 22:43

本发明专利技术涉及一种基于HMM/SOFMNN混合模型的语音情感识别方法，该方法将HMM和SOFMNN模型相结合对语音情感进行识别，其具体包括以下步骤：1)建立情感语音数据库；2)进行语音信号预处理：包括预加重处理、去噪和分帧加窗；3)语音情感特征提取：包括提取语音信号的时间、能量、振幅、基频和共振峰；4)利用HMM/SOFMNN混合模型训练与识别。与现有技术相比，本发明专利技术克服了HMM本身难以解决的模式类别间的相互重叠问题，而且弥补了SOFMNN在获取时序信息方面的不足，提高了语音情感识别率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音情感识别方法，尤其是涉及一种基于HMM/S0FMNN混合模型的语音情感识别方法。
技术介绍
人的语音信号中包含着丰富的情感信息，通过对语音信号的分析来识别人的情感是当前一个十分活跃的研究课题。语音情感识别就是从语音信号中识别出说话人的情感信息，比如“喜、怒、哀、乐”等。语音情感识别在自然人机交互、安全系统自动监管等方面有着广泛的应用前景。语音情感识别是一个模式识别问题，大部分模式识别和分类方法都被尝试用于语音中情感的自动识别。隐马尔可夫模型(HMM)作为语音信号的一种较为理想的统计模型，已经在语音处理领域获得了广泛的应用，并逐渐被应用到语音情感识别领域。隐马尔可夫过程是一种双重随机过程，人的言语过程实际上就是这样一种双重随机过程。HMM合理地模仿了这一过程，很好地描述了语音信号的整体非平稳性和局部平稳性，是较为理想的一种语音模型。但HMM方法有需要语音信号的先验统计知识，分类决策能力较弱等缺点，由于仅考虑了特征的类内变化，而忽略了类间重叠性，仅根据各累积概率的最大值作类别判断，而忽略了各个模式之间的相似特性，因而影响了系统的识别性能，其自适...

【技术保护点】
一种基于HMM/SOFMNN混合模型的语音情感识别方法，其特征在于，该方法将HMM和SOFMNN模型相结合对语音情感进行识别，其具体包括以下步骤：1)建立情感语音数据库；2)进行语音信号预处理：包括预加重处理、去噪和分帧加窗；3)语音情感特征提取：包括提取语音信号的时间、能量、振幅、基频和共振峰；4)利用HMM/SOFMNN混合模型训练与识别。

【技术特征摘要】

【专利技术属性】
技术研发人员：高珏，孙柏林，施建刚，孙弘刚，袁健，陈开，佘俊，许华虎，何永义，
申请(专利权)人：上海上大海润信息系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人