对话情感分析方法及装置、存储介质及处理器制造方法及图纸

技术编号:27561472 阅读:12 留言:0更新日期:2021-03-09 22:03
本发明专利技术公开了一种对话情感分析方法及装置、存储介质及处理器。该方法包括:通过文本的词嵌入技术得到待分析的对话的向量表示和每个对话语句的向量表示;将待分析的对话的向量表示输入主题模型确定整个对话的主题信息的分布;将每个对话语句的向量表示分别输入主题模型确定每个对话语句的主题信息的分布;基于每个词的词向量和整个对话的主题信息的分布得到融入主题信息的词向量;通过融入主题信息的词向量得到上下文相关的句子主题向量,得到每个对话语句的情感分布。本发明专利技术解决了由于相关技术中对对话的分析缺乏整体对话主题的关联,造成了对对话语句的情感分析准确度较低的技术问题。技术问题。技术问题。

【技术实现步骤摘要】
对话情感分析方法及装置、存储介质及处理器


[0001]本专利技术涉及信息分析处理
,具体而言,涉及一种对话情感分析方法及装置、存储介质及处理器。

技术介绍

[0002]在电商领域,由于每个电商商家都有大量的客服人员在服务客户,而客服的服务质量对于客户最终是否购买商品起到很大的影响。通过检测客服在和客户聊天对话过程中客服与客户的情感变化,能够有效地监测客服的服务质量,从而提升客户对于商家的整体满意度,从而促进客户购买商品,提升转化率。
[0003]相关技术中,对于电商客服与客户沟通的一段对话中的每句话可以单独进行情感分类,可以采用传统的机器学习方法,例如,支持向量机、逻辑回归,以及深度学习模型,例如卷积神经网络(Convolutional Neural Networks)、循环神经网络(Recurrent Neural Network),但是此方案缺失了对话中上下文的联系。目前,还有一些对对话文本进行分析的深度学习模型,它们首先使用卷积(循环)神经网络处理词向量(word embedding)得到每个句子的表示,然后基于这些句子表示,采用另外的循环神经网络来捕捉句子之间的关系,或采用注意力机制(Attention Mechanism)来计算句子之间的相关性。但是这些方案没有考虑到对话作为整体所呈现的特点,也没有建立句子所表达意图之间的联系,而仅仅是基于字面意思的匹配上下文。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种对话情感分析方法及装置、存储介质及处理器,以至少解决由于相关技术中对对话的分析缺乏整体对话主题的关联,造成了对对话语句的情感分析准确度较低的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种对话情感分析方法,包括:获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
[0007]进一步地,通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量包括:将所述融入主题信息的词向量输入循环神经网络,得到每个语句的
句子向量;将每个语句的句子向量和所述整个对话的主题信息的分布通过门机制得到所述每个对话语句的上下文相关的句子主题向量。
[0008]进一步地,至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布包括:将所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题向量和所述整个对话的主题信息的分布进行拼接,得到每个对话语句的融入主题信息的句子表示;将所述每个对话语句的融入主题信息的句子表示通过全连接网络,得到每个对话语句的情感分布。
[0009]进一步地,将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布包括:获取每个对话语句中的每个词的词向量;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。
[0010]进一步地,所述主题模型中包括基于神经网络的模型。
[0011]进一步地,所述神经网络的模型至少包括:编码层和解码层,其中,在所述编码层中输入是所述待分析的对话的向量表示,通过多层全连接网络得到整个对话的主题信息的分布;在所述解码层中,基于所述每个对话语句中每个词的词向量和每个对话语句的向量表示得到每个主题信息的概率分布,结合所述整个对话的主题信息的分布得到所述待分析的对话的似然函数。
[0012]进一步地,所述主题模型至少包括:词表示层、句子表示层和输出层,其中,在所述词表示层中,基于每个对话语句中每个词的词向量和所述整个对话的主题分布通过门机制得到每个对话语句中融入主题信息的词向量;在所述句子表示层中,将所述融入主题信息的词向量通过循环神经网络到所述每个对话语句的向量表示;基于所述每个对话语句的向量表示和所述整个对话的主题分布通过门机制得到每个对话语句的融入主题信息的向量表示;在所述输出层中,基于所述每个对话语句的融入主题信息的向量表示,得到每个对话语句的情感分布。
[0013]进一步地,所述情感分布为以下之一:非常负面、一般负面、中性、一般正面、非常正面。
[0014]进一步地,所述对话情感分析方法应用于电商领域。
[0015]根据本专利技术实施例的一个方面,提供了一种对话情感分析装置,包括:第一获取单元,用于获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;第二获取单元,用于通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;第一确定单元,用于将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;第二确定单元,用于将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;第三获取单元,用于基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;第四获取单元,用于通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;第五获取单元,用于至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。
[0016]根据本专利技术实施例的一个方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述任意一项所述的对话情感分析方法。
[0017]根据本专利技术实施例的一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的对话情感分析方法。
[0018]在本专利技术实施例中,通过获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话情感分析方法,其特征在于,包括:获取待分析的对话,其中,所述待分析的对话中包括多个对话语句;通过文本的词嵌入技术,得到所述待分析的对话的向量表示和所述待分析的对话中每个对话语句的向量表示;将所述待分析的对话的向量表示输入主题模型,确定整个对话的主题信息的分布;将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量;通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量;至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布。2.根据权利要求1所述的方法,其特征在于,通过所述融入主题信息的词向量得到所述每个对话语句的上下文相关的句子主题向量包括:将所述融入主题信息的词向量输入循环神经网络,得到每个语句的句子向量;将每个语句的句子向量和所述整个对话的主题信息的分布通过门机制得到所述每个对话语句的上下文相关的句子主题向量。3.根据权利要求1所述的方法,其特征在于,至少基于所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题信息的分布和所述整个对话的主题信息的分布,得到每个对话语句的情感分布包括:将所述每个对话语句的上下文相关的句子主题向量、所述每个对话语句的主题向量和所述整个对话的主题信息的分布进行拼接,得到每个对话语句的融入主题信息的句子表示;将所述每个对话语句的融入主题信息的句子表示通过全连接网络,得到每个对话语句的情感分布。4.根据权利要求1所述的方法,其特征在于,将所述待分析的对话中每个对话语句的向量表示分别输入所述主题模型,确定每个对话语句的主题信息的分布包括:获取每个对话语句中的每个词的词向量;基于每个对话语句中的每个词的词向量和所述整个对话的主题信息的分布得到每个对话语句中融入主题信息的词向量。5.根据权利要求1所述的方法,其特征在于,所述主题模型中包括基于神经网络的模型。6.根据权利要求5所述的方法,其特征在于,所述神经网络的模型至少包括:编码层和解码层,其中,在所述编码层中输入是所述待分析的对话的向量表示,通过多层全连接网络得到整个对话的主题信息的分布;在所述解码层中...

【专利技术属性】
技术研发人员:王建成宋凯嵩孙常龙林君司罗
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1