一种基于深度学习的会话情感自动分析方法技术

技术编号：13044123 阅读：93 留言：0更新日期：2016-03-23 13:19

本发明专利技术公开了一种基于深度学习的会话情感自动分析方法，属于自然语言处理、数据挖掘领域。本发明专利技术基于去噪自编码器学习语音和文本的表示，再通过深度学习方法将两种表示深度融合，得到高层的统一表示，基于融合后的高层表示再进行情感分析。利用本发明专利技术提供的技术方案，可以深度融合声学和文本两种特征，提高情感分类的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于自然语言处理、数据挖掘领域，具体涉及基于深度学习的语音会话中的情感分析方法。
技术介绍
语音会话的情感分析是通过分析话语来判断会话人的情感状态，如高兴、满意、愤怒等。语音会话大量存在于实际领域，包括各种呼叫中心、人机交互系统等。会话情感自动分析有助于动态了解会话人的心理状态和情绪情感变化，有着广阔的应用前景。以呼叫中心为例，通过分析客服对话过程中会话人的情绪和情感变化，管理人员可以发现客户服务过程中服务员态度是否友好，客户是否有不满情绪，以尽早解决问题。针对语音会话的情感分析，一般的做法是对一段话提取一系列声学特征，基于这些声学特征训练分类器。然而，只使用声学特征的问题在于无法考虑到话语的语义信息，而语义与情感是密切相关的。近些年来，语言信息逐步受到重视。通常做法是使用自动语音识别(ASR)技术将语音转换为文本，然后从文本中提取一系列文本特征，再利用音学和文本二种特征进行会话的情感分析。基于声学和文本两种特征，目前主要有两种方法：一是先分别用两种特征训练两个独立的分类器，然后将两个独立分类器的结果再进行结合，得到最终结果。这种方法只对两种分类结果进行结合，忽视了特征之间的关联性。二是将两种特征直接合并，在合并的基础上再进行分类。然而，声学特征和文本特征的低层表示通常是非线性关系，这种直接合并难以捕获到两种特征之间的关联，而且合并后的维度可能非常大。本专利技术的主要目的是通过深度学习方法将声学...

【技术保护点】
一种会话情感自动分析方法，具体包括如下步骤：A.将一通对话根据说话人转变和声音停顿分割为若干段语音；B.使用ASR技术将语音转换为文本；C.提取声学特征，执行如下操作：C1.提取一段语音中每一帧的特征；C2.基于多个统计量得到一段语音的全局特征；D.提取文本特征，执行如下操作：D1.基于大规模语料训练，学习到每个词的向量表示；D2.基于词向量计算口语会话中每段文本的表示；E.形成两种特征的融合表示并进行情感分类，执行如下操作：E1.分别学习声学特征和文本特征的表示；E2.通过深度学习，再将两种表示进行深度融合，得到高层表示；E3.基于融合的高层表示训练分类器，对每段语音分类。

【技术特征摘要】
1.一种会话情感自动分析方法，具体包括如下步骤：
A.将一通对话根据说话人转变和声音停顿分割为若干段语音；
B.使用ASR技术将语音转换为文本；
C.提取声学特征，执行如下操作：
C1.提取一段语音中每一帧的特征；
C2.基于多个统计量得到一段语音的全局特征；
D.提取文本特征，执行如下操作：
D1.基于大规模语料训练，学习到每个词的向量表示；
D2.基于词向量计算口语会话中每段文本的表示；
E.形成两种特征的融合表示并进行情感分类，执行如下操作：
E1.分别学习声学特征和文本特征的表示；
E2.通过深度学习，再将两种表示进行深度融合，得到高层表示；
E3.基于融合的高层表示训练分类器，对每段语音分类。
2.如权利要求1所述的会话情感自动分析方法，其特征在于，步骤A具体执行如下操作：
A1.识别说话人转换点的候选；
A2.通过聚...

【专利技术属性】
技术研发人员：张晓东，王厚峰，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人