语音数据情感检测方法和装置及系统制造方法及图纸

技术编号:15508013 阅读:108 留言:0更新日期:2017-06-04 02:28
本申请提出一种语音数据情感检测方法和装置及系统,该语音数据情感检测方法包括:接收待检测语音数据;获取所述待检测语音数据的情感检测特征和历史状态特征,所述情感检测特征包括:声学情感检测特征和语义情感检测特征;根据预先构建的情感检测模型、所述情感检测特征和所述历史状态特征,识别所述待检测语音数据的情感类型,所述情感检测模型根据获取的语音数据样本的情感检测特征和历史状态特征构建得到。该方法能够提高语音数据的情感类型的检测准确度。

Voice data emotion detection method, device and system

The invention provides a voice data emotion detection method and device and system, including the voice data detection method to detect the speech emotion: data reception; emotion detection features and historical characteristics obtained by the detection of speech data, including the characteristics of emotion detection: acoustic emotion detection features and semantic characteristics based on affective emotion detection; the detection model, the emotion detection characteristics of pre built and the historical state characteristics, the identification of the detected speech data types of emotion, the emotion detection model based on voice data acquisition like emotion detection features and historical status characteristics of the construct. The method can improve the detection accuracy of emotion types of speech data.

【技术实现步骤摘要】
语音数据情感检测方法和装置及系统
本申请涉及自然语言理解及语音信号处理
,尤其涉及一种语音数据情感检测方法和装置及系统。
技术介绍
随着呼叫中心业务的不断发展,客服服务总量越来越大,客户对服务的质量要求也越来越高;对于呼叫中心来说,服务质量是呼叫中心的生存之本;尤其是在客户带着情绪或疑问拨入热线时,客服人员很难在第一时间了解客户的真实想法和需求,无法做出准确的应答,进而容易放大客户的不满情绪,客服在这种情况下也容易出现带有情绪的表达;因此,为了提高服务质量,呼叫中心一般会对客服与客户的通话进行监测,同时对客服的语音数据进行情感检测,当客服出现不满情绪时,给出提示,方便客服及时调整自己的情绪。相关技术中,语音数据情感检测方法一般通过对语音信号进行分析的方法进行情感检测,具体检测时,首先接收待检测语音数据;然后对所述待检测语音数据进行信号分析,如分析待检测语音数据音量、语速、能量、基频、声调等时域特征,设定相应阈值,判断待检测语音数据的情感类型。所述方法仅仅对语音数据进行声学上的分析,由于一些带有情感色彩的词语往往在声学上没有明显的异常,仅仅通过分析语音信号无法检测出语音数据所属情感,从而导致语音数据的情感类型的检测准确度较低。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种语音数据情感检测方法,该方法可以提高语音数据的情感类型的检测准确度。本申请的另一个目的在于提出一种语音数据情感检测装置。本申请的另一个目的在于提出一种语音数据情感检测系统。为达到上述目的,本申请第一方面实施例提出的语音数据情感检测方法,包括:接收待检测语音数据;获取所述待检测语音数据的情感检测特征和历史状态特征,所述情感检测特征包括:声学情感检测特征和语义情感检测特征;根据预先构建的情感检测模型、所述情感检测特征和所述历史状态特征,识别所述待检测语音数据的情感类型,所述情感检测模型根据获取的语音数据样本的情感检测特征和历史状态特征构建得到。本申请第一方面实施例提出的语音数据情感检测方法,通过依据情感检测模型以及声学上和语义上的特征进行识别,可以提高语音数据的情感检测的准确度。为达到上述目的,本申请第二方面实施例提出的语音数据情感检测装置,包括:接收模块,用于接收待检测语音数据;获取模块,用于获取所述待检测语音数据的情感检测特征和历史状态特征,所述情感检测特征包括:声学情感检测特征和语义情感检测特征;识别模块,用于根据预先构建的情感检测模型、所述情感检测特征和所述历史状态特征,识别所述待检测语音数据的情感类型,所述情感检测模型根据获取的语音数据样本的情感检测特征和历史状态特征构建得到。本申请第二方面实施例提出的语音数据情感检测装置,通过依据情感检测模型以及声学上和语义上的特征进行识别,可以提高语音数据的情感检测的准确度。为达到上述目的,本申请第三方面实施例提出的语音数据情感检测系统,包括:客户端,用于采集说话人说出的待检测语音数据;服务端,用于接收所述客户端发送的所述待检测语音数据;获取所述待检测语音数据的情感检测特征和历史状态特征,所述情感检测特征包括:声学情感检测特征和语义情感检测特征;以及,根据预先构建的情感检测模型、所述情感检测特征和所述历史状态特征,识别所述待检测语音数据的情感类型,所述情感检测模型根据获取的语音数据样本的情感检测特征和历史状态特征构建得到。本申请第三方面实施例提出的语音数据情感检测系统,通过依据情感检测模型以及声学上和语义上的特征进行识别,可以提高语音数据的情感检测的准确度。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本申请一个实施例提出的语音数据情感检测方法的流程示意图;图2是本申请另一个实施例提出的语音数据情感检测方法的流程示意图;图3是本申请另一个实施例提出的语音数据情感检测方法的流程示意图;图4是本申请实施例中获取情感检测特征的方法的流程示意图;图5是本申请一个实施例提出的语音数据情感检测装置的结构示意图;图6是本申请另一个实施例提出的语音数据情感检测装置的结构示意图;图7是本申请一个实施例提出的语音数据情感检测系统的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本申请一个实施例提出的语音数据情感检测方法的流程示意图。如图1所示,本实施例的方法包括:S11:接收待检测语音数据。待检测语音数据例如为客服与客户通话时的客服语音数据。当然,所述待检测语音数据也可以为其它语音数据,如客户语音数据、采访时采访人的语音数据、会议时主持人的语音数据等,具体可以根据应用需求确定。待检测语音数据可以以句为单位,从而可以对应每句语音数据进行情感检测,得到每句语音数据的情感类型,以便根据检测得到的情感类型及时通知客服注意自己的情绪,如说话用词或说话语气等。以句为单位的待检测语音数据可以为单句语音数据,或者,也可以为多句连续语音数据中的每一句。S12:获取所述待检测语音数据的情感检测特征和历史状态特征,所述情感检测特征包括:声学情感检测特征和语义情感检测特征。声学情感检测特征是指语音数据的声学上的特征,语义情感检测特征是指语音数据的语义上的特征。在后续内容中,还会涉及获取样本的情感检测特征的步骤,因此,此处的语音数据以及后续的样本可以统称为待提取语音数据。具体的获取待提取语音数据的情感检测特征的方法可以参见后续内容。以句为单位对语音数据情感进行检测时,当前句的语音数据的历史状态特征是指当前句所属的一段语音数据中,当前句之前的每句语音数据的情感类型,当待检测语音数据为单句语音数据或多句连续语音数据的首句时,历史状态特征为0;当待检测语音数据为多句连续语音数据的非首句时,则待检测语音数据的历史状态特征为连续语音数据中当前句之前每句待检测语音数据的情感类型。S13:根据预先构建的情感检测模型、所述情感检测特征和所述历史状态特征,识别所述待检测语音数据的情感类型,所述情感检测模型根据获取的语音数据样本的情感检测特征和历史状态特征构建得到。具体构建情感检测模型的方法可以参见后续描述。情感检测模型的输入为情感检测特征和历史状态特征,输出为情感类型信息,从而在获取到待检测语音数据的情感检测特征和历史状态特征后,将获取的情感检测特征和历史状态特征作为情感检测模型的输入,得到情感检测模型输出的情感类型信息,再根据情感类型信息确定待检测语音数据的情感类型,比如,情感类型信息为每种预设情感类型的概率值,则将概率值最高的情感类型确定为待检测语音数据的情感类型。所述语音数据的情感类型是指按照语音数据中句子的情感将句子划分的类型,情感类型包括但不限于:中性、负向、正向等。进一步地,在检测得到语音数据的情感类型后,可以将情感类型及时本文档来自技高网...
语音数据情感检测方法和装置及系统

【技术保护点】
一种语音数据情感检测方法,其特征在于,包括:接收待检测语音数据;获取所述待检测语音数据的情感检测特征和历史状态特征,所述情感检测特征包括:声学情感检测特征和语义情感检测特征;根据预先构建的情感检测模型、所述情感检测特征和所述历史状态特征,识别所述待检测语音数据的情感类型,所述情感检测模型根据获取的语音数据样本的情感检测特征和历史状态特征构建得到。

【技术特征摘要】
1.一种语音数据情感检测方法,其特征在于,包括:接收待检测语音数据;获取所述待检测语音数据的情感检测特征和历史状态特征,所述情感检测特征包括:声学情感检测特征和语义情感检测特征;根据预先构建的情感检测模型、所述情感检测特征和所述历史状态特征,识别所述待检测语音数据的情感类型,所述情感检测模型根据获取的语音数据样本的情感检测特征和历史状态特征构建得到。2.根据权利要求1所述的方法,其特征在于,还包括:构建情感检测模型,所述构建情感检测模型包括:获取语音数据样本;对所述语音数据样本进行语音识别,得到识别文本数据样本;获取对所述识别文本数据样本标注的情感类型,并将所述标注的情感类型作为所述语音数据样本的情感类型;获取所述语音数据样本的情感检测特征和历史状态特征;根据所述语音数据样本的情感检测特征和历史状态特征以及所述语音数据样本的情感类型,进行模型训练,构建得到情感检测模型。3.根据权利要求1所述的方法,其特征在于,获取待检测语音数据的语义情感检测特征,包括:对待检测语音数据进行语音识别,得到识别文本数据;对识别文本数据进行语义特征提取,得到语义情感检测特征,所述语义情感检测特征包括如下项中的至少一项:句长度特征、句中重复词数特征、句向量特征、句子情感极性特征。4.根据权利要求3所述的方法,其特征在于,所述句子情感极性特征采用如下方法提取得到:计算每种情感类型识别文本数据中词的语义类;分别计算每种情感类型识别文本数据中词的语义类的中心点;分别计算每句识别文本数据中每个词与每个语义类中心点的语义距离,得到每个词与每个语义类的语义距离向量;计算每句识别文本数据中每个词与每个语义类中心点的语义距离向量的平均值,将所述语义距离向量的平均值作为每句识别文本的情感极性特征。5.根据权利要求1所述的方法,其特征在于,获取待检测语音数据的声学情感检测特征,包括:直接对所述待检测语音数据进行声学特征提取,得到声学情感检测特征,所述声学情感检测特征包括如下项中的至少一项:短时斜率变化率、短时平均能量、短时平均过零率、短时自相关系数、短时平均幅度差。6.根据权利要求1所述的方法,其特征在于,所述待检测语音数据以句为单位进行处理,所述历史状态特征包括:如果所述待检测语音数据为单句语音数据或者多句连续语音数据的首句,则所述历史状态特征为0;或者,如果所述待检测语音数据为多句连续语音数据的非首句时,则所述历史状态特征为所述多句连续语音数据中所述待检测语音数据之前的每句语音数据的情感类型。7.一种语音数据情感检测装置,其特征在于,包括:接收模块,用于接收待检测语音数据;获取模块,用于获取所述待检测语音数据的情感检测特征和历史状态特征,所述情感检测特征包括:声学情感检测特征和语义情感检测特征;识别模块,用于根据预先构建的情感检测模型、所述情感检测特征和所述历史状态特征,识别所述待检测语音数据的情感类型,所述情感检测模型根据获取的语音数据样本的情...

【专利技术属性】
技术研发人员:李宝善李承程
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1