一种情感识别方法和情感识别系统技术方案

技术编号:17781709 阅读:23 留言:0更新日期:2018-04-22 11:25
本发明专利技术实施例公开了一种情感识别方法和情感识别系统,其中,该方法包括:获取当前语音信号;提取当前语音信号的语音特征,语音特征包括:声学特征和文本特征;根据语音特征和预设深度模型,识别当前语音信号对应的情感类型,情感类型包括:正面、中性和负面,本发明专利技术的技术方案能够通过语音信号识别出对应的情感类型,以对服务人员进行监督提高服务水平。

【技术实现步骤摘要】
一种情感识别方法和情感识别系统
本专利技术实施例涉及通信
,具体涉及一种情感识别方法和情感识别系统。
技术介绍
在人与人之间的交流中,语言是最自然和重要的手段之一。说话者的言语中夹带的情感会对周围人的情绪产生极大的影响,其中,情感包括:正面和负面,尤其是服务人员,例如,在公交车、敬老院或者医院等公共场合,若服务人员态度恶劣,语气傲慢,语言粗鄙,即情感为负面,就会对被服务人员造成不好的影响,不利于社会和谐和提高幸福指数。经专利技术人研究发现,目前没有一种有效的技术手段能够通过服务人员的言语判断出其对应的情感,以对其监督提高服务水平。
技术实现思路
为了解决上述技术问题,本专利技术实施例提供了一种情感识别方法和情感识别系统,能够通过语音信号识别出对应的情感。在一个方面,本专利技术实施例提供了一种情感识别方法,包括:获取当前语音信号;提取当前语音信号的语音特征,所述语音特征包括:声学特征和文本特征;根据所述语音特征和预设深度模型,识别所述当前语音信号对应的情感类型,所述情感类型包括:正面、中性和负面。可选地,所述提取当前语音信号的语音特征之前,所述方法还包括:对所述当前语音信号进行预处理。可选地,所述识别所述当前语音信号对应的情感类型之后,所述方法还包括:根据所述情感类型,激活对应的预设应对方案。可选地,所述声学特征包括:基频、时长、能量和频谱。可选地,所述根据所述语音特征和预设深度模型,识别所述当前语音信号对应的情感类型包括:根据声学特征和文本特征,获得用于情感识别的声学特征信息和文本特征信息;根据所述声学特征信息,获得K个声学特征向量;根据K个声学特征向量和文本特征信息,获得K个文本特征向量;根据K个声学特征向量、K个文本特征向量和预设深度模型,识别当前语音信号的情感类型。可选地,所述根据声学特征和文本特征,获得用于情感识别的声学特征信息和文本特征信息包括:将声学特征和文本特征分别转化为对应的向量;将声学特征对应的向量和文本特征对应的向量分别输入卷积神经网络,获得用于情感识别的声学特征信息和文本特征信息。可选地,所述根据所述声学特征信息,获得K个声学特征向量包括:将所述声学特征信息池化,获得K个声学特征向量;所述根据K个声学特征向量和文本特征信息,获得K个文本特征向量包括:根据K个声学特征向量的均值对文本特征信息采用聚焦机制聚焦;将聚焦后的文本特征信息池化,获得K个文本特征向量。另一方面,本专利技术实施例还提供一种情感识别系统,包括:语音获取模块,被配置为获取当前语音信号;特征提取模块,被配置为提取当前语音信号的语音特征,所述语音特征包括:声学特征和文本特征;情感识别模块,被配置为根据所述语音特征和预设深度模型,识别所述当前语音信号对应的情感类型,所述情感类型包括:正面、中性和负面。可选地,所述系统还包括:信号预处理模块和激活模块;所述信号预处理模块,被配置为对所述当前语音信号进行预处理;所述激活模块,被配置为根据所述情感类型,激活对应的预设应对方案。可选地,所述情感识别模块包括:第一获得单元,被配置为根据声学特征和文本特征,获得用于情感识别的声学特征信息和文本特征信息,具体包括:将声学特征和文本特征分别转化为对应的向量;将声学特征对应的向量和文本特征对应的向量分别输入卷积神经网络,获得用于情感识别的声学特征信息和文本特征信息;所述声学特征包括:基频、时长、能量和频谱;第二获得单元,被配置为根据所述声学特征信息,获得K个声学特征向量,具体包括:将所述声学特征信息池化,获得K个声学特征向量;还被配置为根据K个声学特征向量和文本特征信息,获得K个文本特征向量,具体包括:根据K个声学特征向量的均值对文本特征信息采用聚焦机制聚焦;将聚焦后的文本特征信息池化,获得K个文本特征向量;情感识别单元,被配置为根据K个声学特征向量、K个文本特征向量和预设深度模型,识别当前语音信号的情感类型。本专利技术实施例提供一种情感识别方法和情感识别系统,其中,该方法包括:获取当前语音信号;提取当前语音信号的语音特征,语音特征包括:声学特征和文本特征;根据所述语音特征和预设深度模型,识别所述当前语音信号对应的情感类型,所述情感类型包括:正面、中性和负面,本专利技术的技术方案能够通过语音信号识别出对应的情感类型,以对服务人员进行监督提高服务水平。当然,实施本专利技术的任一产品或方法并不一定需要同时达到以上所述的所有优点。本专利技术的其它特征和优点将在随后的说明书实施例中阐述,并且,部分地从说明书实施例中变得显而易见,或者通过实施本专利技术而了解。本专利技术实施例的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术实施例提供的情感识别方法的一个流程图;图2为本专利技术实施例提供的情感识别方法的另一流程图;图3为本专利技术实施例提供的步骤300的流程图;图4为本专利技术实施例提供的情感识别系统的一个结构框图;图5为本专利技术实施例提供的情感识别系统的另一结构框图;图6为本专利技术实施例提供的情感识别模块的结构框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。为了说明本专利技术实施例所述的技术方案,下面通过具体实施例来进行说明。实施例一图1为本专利技术实施例提供的情感识别方法的一个流程图,如图1所示,本专利技术实施例提供的情感识别方法具体包括以下步骤:步骤100、获取当前语音信号。具体的,步骤100通过麦克风或者麦克风阵列获取语音信号。步骤200、提取当前语音信号的语音特征。其中,语音特征包括:声学特征和文本特征。可选地,声学特征包括:基频、时长、能量和频谱,其中,基频决定音调高低,通过自相关算法提取基频特征;时长与语速相关,当前语音信号中的无声信息对于情感识别也是有价值的,通过VisualSpeech工具提取时长特征;能量与振幅有关,可以通过现有的技术提取能量特征和频谱特征。可选地,文本特征即为当前语音信号中的文本信息,通过语音识别技术例如科大讯飞的Auto-SpeechRecognition提取文本特征。步骤300、根据语音特征和预设深度模型,识别当前语音信号对应的情感类型。其中,情感类型包括:正面、中性和负面,需要说明的是,正面的情感类型可以使被服务人员愉悦,中性的情感类型不会对被服务人员的情绪产生影响,而负面的情感类型就会使被服务人员觉得不舒服。对于同一句话,如“你是傻瓜”,可能是一个人在调侃朋友,也有可能是嘲笑敌手,情感可能正面也可能负面。需要说明的是,预设深度模型经过样本数据库进行大量训练,使得识别出来的情感类型的准确率较高。可选地,本专利技术实施例提供的情感识别方法可以应用于公交车、敬老院、医院等公共场合。本专利技术实施例提供的情感识别方法,包括:获取当前语音信号;提取当前语音信号的语音特征,语音特征包括:声学特征和文本特征;根据语音特征和预设深度模型,识别当前语音信号对应的情感类型,情感类型包括:正面、中性和负面,本专利技术的技术方案能够通过语音信号识别出对应的情感类本文档来自技高网...
一种情感识别方法和情感识别系统

【技术保护点】
一种情感识别方法,其特征在于,包括:获取当前语音信号;提取当前语音信号的语音特征,所述语音特征包括:声学特征和文本特征;根据所述语音特征和预设深度模型,识别所述当前语音信号对应的情感类型,所述情感类型包括:正面、中性和负面。

【技术特征摘要】
1.一种情感识别方法,其特征在于,包括:获取当前语音信号;提取当前语音信号的语音特征,所述语音特征包括:声学特征和文本特征;根据所述语音特征和预设深度模型,识别所述当前语音信号对应的情感类型,所述情感类型包括:正面、中性和负面。2.根据权利要求1所述的方法,其特征在于,所述提取当前语音信号的语音特征之前,所述方法还包括:对所述当前语音信号进行预处理。3.根据权利要求1或2所述的方法,其特征在于,所述识别所述当前语音信号对应的情感类型之后,所述方法还包括:根据所述情感类型,激活对应的预设应对方案。4.根据权利要求1所述的方法,其特征在于,所述声学特征包括:基频、时长、能量和频谱。5.根据权利要求1所述的方法,其特征在于,所述根据所述语音特征和预设深度模型,识别所述当前语音信号对应的情感类型包括:根据声学特征和文本特征,获得用于情感识别的声学特征信息和文本特征信息;根据所述声学特征信息,获得K个声学特征向量;根据K个声学特征向量和文本特征信息,获得K个文本特征向量;根据K个声学特征向量、K个文本特征向量和预设深度模型,识别当前语音信号的情感类型。6.根据权利要求5所述的方法,其特征在于,所述根据声学特征和文本特征,获得用于情感识别的声学特征信息和文本特征信息包括:将声学特征和文本特征分别转化为对应的向量;将声学特征对应的向量和文本特征对应的向量分别输入卷积神经网络,获得用于情感识别的声学特征信息和文本特征信息。7.根据权利要求5或6所述的方法,其特征在于,所述根据所述声学特征信息,获得K个声学特征向量包括:将所述声学特征信息池化,获得K个声学特征向量;所述根据K个声学特征向量和文本特征信息...

【专利技术属性】
技术研发人员:王雪云
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1