当前位置: 首页 > 专利查询>东南大学专利>正文

负面情绪检测中的基于上下文修正的语音情感识别方法技术

技术编号:9668971 阅读:197 留言:1更新日期:2014-02-14 08:13
本发明专利技术公开了一种负面情绪检测中的基于上下文修正的语音情感识别方法,属于语音信号处理领域。本发明专利技术首先采集情感数据,并对其中的每一条语音进行特征提取,并且运用主分量分析的降维技术降低特征的维数,而后采用基于高斯混合模型的两类分类器分别对四类情感进行判别,得到当前时刻的情感矢量,最后根据前一时刻的情感矢量和当前的认知作业成绩来修正当前时刻的情感矢量,从而得到最终的语音情感识别结果。本发明专利技术可以有效的提高单纯采用高斯混合分类器的语音情感识别方法的识别性能,有效地检测认知过程相关的负面情绪状态。特别是在航天航海等特殊工作环境下,对检测和调节工作人员的负面情绪具有重要的应用价值。

【技术实现步骤摘要】

本专利技术涉及,属于语音信号处 理领域。
技术介绍
认知作业中的负面情绪的检测具有重要的实际意义,特别是在航天航海等长时间的、 高强度的工作环境中,对工作人员的负面情绪的及时检测和调控非常重要。烦躁、疲劳、迟 疑和自信等与情绪有关的心理状态对认知过程有密切的影响,是评估人员的心理状态和认 知作业水平的一个重要因素。认知心理学的研究表明,负面情绪对认知能力有影响。已有报道表明,负面情绪会 影响到对视觉目标的识别能力。一个自动识别人类情感的系统会在很多领域发挥重大的作 用,例如,在车载系统中可以帮助驾驶员调节烦躁情绪从而避免事故;在公共场所的监视系 统中,对恐惧等极端情绪的检测,可以帮助识别潜在的危险情况。语音是反映和表达情绪的一种重要的方式。通过对语音中包含的情感信息进行识 别可以有效地检测出特定对象的负面情绪。目前用于负面情绪检测中的语音情感识别方法 是基于各个时刻单个状态的。在实际条件下情感语音是连续的,前一个状态的情感对后续 状态的检测能够提供有用的信息。利用这样的上下文信息可以提高系统的性能。因此,如何 利用上下文关联信息来进行语音情感识别,从而进行负面情绪的检测,十分重要。而目前, 还未出现这样的方法。
技术实现思路
本专利技术提出了 一种,对检测和 调节工作人员的负面情绪具有重要的应用价值。本专利技术为解决其技术问题采用如下技术方案:,其特征在于包括以下步骤:(1)采集情感数据,对每一段采集到的语音数据标注其情感,包括烦躁、疲劳、迟疑和自f目;(2)对于采集到的每一条语音,提取372个特征,然后采用主分量分析技术将特征矢量 的维数降到10-30。(3)利用高斯混合模型(GMM)分类器对每一类情感进行训练和识别:这里选用的 是将结果分为两类的GMM分类器,S卩,待识别的一类情感用一个GMM来表达,所有其他情感 类型用另一个GMM来表达;如果通过两类GMM分类器判定结果为,该情感出现,则输出为1, 否则为O。如果对于烦躁、疲劳、迟疑和自信这四种情感,对应的两类分类器的输出都为0, 则认为当前情感语句为中性情感。这一步得到的是当前情感分类器的输出;四种情感分类 器的输出组成一个情感矢量:EiHHpCi],此处I代表连续情感语音中的识别序列顺序,A、T、H、C代表烦躁、疲劳、迟疑和自信四种与情感有关的心理状态。(4)结合上下文来最终确定当前的情感状态:根据前一个情感状态的识别结果和当前的认知作业成绩来修正上一步得到的当前情感分类器的输出,从而判定出最终的情感类别。在所述的中,所述的372 维特征包括:基音和基音一阶差分的最大值、最小值、均值、标准差、范围;嗓音的撕喊声、 粗燥声;第一到第四共振峰及其一阶差分的最大值、最小值、均值、方差、范围;短时能量及其一阶差分的最大值、最小值、均值、方差和范围;一到十三阶美尔频率倒谱系数(MFCC)及其一阶差分的最大值、最小值、均值、方差和范围;一到十八阶巴赫频带能量的最大值、最小值、均值、方差和范围。在所述的中,所述的结合上下文来最终确定当前情感状态的过程如下:本文档来自技高网...

【技术保护点】
一种负面情绪检测中的基于上下文修正的语音情感识别方法,其特征在于,包括以下步骤:(1)采集情感数据,对每一段采集到的语音数据标注其情感,包括烦躁、疲劳、迟疑和自信;?(2)对于采集到的每一条语音,提取372个特征,然后采用主分量分析技术将特征矢量的维数降到10??30;(3)利用高斯混合模型分类器对每一类情感进行训练和识别:这里选用的是将结果分为两类的GMM分类器,即,待识别的一类情感用一个GMM来表达,所有其他情感类型用另一个GMM来表达;如果通过两类GMM分类器判定结果为,该情感出现,则输出为1,否则为0;如果对于烦躁、疲劳、迟疑和自信这四种情感,对应的两类分类器的输出都为0,则认为当前情感语句为中性情感;这一步得到的是当前情感分类器的输出;四种情感分类器的输出组成一个情感矢量:,此处代表连续情感语音中的识别序列顺序,、、、代表烦躁、疲劳、迟疑和自信四种与情感有关的心理状态;??????(4)结合上下文来最终确定当前的情感状态:根据前一个情感状态的识别结果和当前的认知作业成绩来修正上一步得到的当前情感分类器的输出,从而判定出最终的情感类别。722909dest_path_image001.jpg,451830dest_path_image002.jpg,343694dest_path_image003.jpg,903988dest_path_image004.jpg,675635dest_path_image005.jpg,439323dest_path_image006.jpg...

【技术特征摘要】
1.一种负面情绪检测中的基于上下文修正的语音情感识别方法,其特征在于,包括以下步骤:(1)采集情感数据,对每一段采集到的语音数据标注其情感,包括烦躁、疲劳、迟疑和自 2.根据权利要求1所述的负面情绪检测中的基于上下文修正的语音情感识别方法,其特征在于,所述的步骤(2)中的372维特征包括:基音和基音一阶差分的最大值、最小值、 均值、标准差、范围;嗓音的撕喊声、粗燥声;第一到第四共振峰及其一阶差分的...

【专利技术属性】
技术研发人员:赵力刘汝杰黄程韦魏昕包永强余华阴法明
申请(专利权)人:东南大学富士通株式会社
类型:发明
国别省市:

网友询问留言 已有1条评论
  • 来自[北京市联通互联网数据中心] 2014年12月11日 14:03
    负面通常指情绪生活等等也包括负评遭人非议的所思
    0
1