一种人机共情对话方法、系统、电子设备和介质技术方案

技术编号:36753704 阅读:14 留言:0更新日期:2023-03-04 10:42
本发明专利技术涉及智能机器人、开放领域对话系统技术领域,具体涉及一种人机共情对话方法、系统、电子设备和介质,包括建立人机共情对话模型,所述人机共情对话模型包括情绪上下文编码器和情绪解码器;将历史对话数据输入至所述情绪上下文编码器中,得到所述历史对话数据对应的情绪上下文变量以及情绪信号,实现对所述历史对话数据表达的情绪进行更精确的感知;将所述情绪上下文变量以及情绪信号输入至情绪解码器中进行解码,最终得到针对该历史对话数据更具共情的回复。本发明专利技术使得词语对于每一个情绪的表达程度都有所体现,以此展示出词语和情绪的倾向程度,从而能更精确的感知用户语句所表达的情绪。表达的情绪。表达的情绪。

【技术实现步骤摘要】
一种人机共情对话方法、系统、电子设备和介质


[0001]本专利技术涉及智能机器人、开放领域对话系统
,具体涉及一种人机共情对话方法、系统、电子设备和介质。

技术介绍

[0002]共情是一种复杂的社会情绪行为,是情绪和认知机制相互作用的结果。人机对话旨在研究如何使计算机来理解和运用人类社会的自然语言,并通过感知情绪来加强与人类用户的联系,从而提升用户的满意度,其在对话领域有着重要作用。在现有的共情反应研究中,
[0003](Zhou and Wang 2018;Zhou et al.2018a;Wang and Wan 2018;Song et al.2019;Shen and Feng2020)通过一个指定的情绪标签来控制生成的内容;(Rashkin等人,2019年;Lin等人,2019年;Majumder等人,2020年;Li等人,2020a,19)提出了多种产生移情反应的方法,其主要是对用户的情绪进行检测,根据用户的情绪生成相应的回复;(Zhong,Wang,and Miao 2019b,KEMP)则是通过经验或外部知识来感知隐含的情绪,使得共情对话系统从有限的对话历史中学习情绪交互的问题。
[0004]然而,上述情绪检测模型未考虑到对话中的每个词语与情绪的倾向程度。受多粒度计算思想的启发,可以注意到在实际的多轮对话中,用户所表达的情绪不只是和情绪词有关,非情绪词也同样表达了用户的潜在情绪。因此,精确感知所有词的情绪倾向程度对于情绪的理解有着重要意义。说明书附图中图1展示了一个真实世界的移情对话例子。在该实例中,Speaker为演讲者描述的内容,红色文字表示的是主体,蓝色部分表示侧重于”my friend

sbaby”主体所生成的回复,而绿色部分表示侧重于”i”主体所生成的回复。Pred展示的是KEMP生成的回复,而Ref则是标准回复。对比Pred和Ref的回复内容,两者在生成对话内容时的主体是不一样的。
[0005]在开放域对话系统中,单轮对话的表现形式为一问一答,而多轮对话系统的表现形式则为多次对话。多轮对话系统与单轮对话系统的区别在于多轮对话会考虑到历史对话内容。在前期的情绪对话研究中,Seq2Seq对于不定长的语言序列问题,其采用编码器和解码器结构,将提取的特征映射到输出,但当对话很长时则会出现长序列梯度消失的问题。因此,Bahdanau等人在Seq2Seq的基础上提出了适应该框架的注意力Attention机制,让模型在解码的时候自适应的关注编码中的更重要的信息,提取有利语义特征;Zhou等人在Seq2Seq的基础上提出了ECM框架,在原始的解码器的基础上,加入了情绪内部动态模拟机制以及基于词典的自适应回复生成机制,使解码器在生成序列文本时更好地利用情绪表达的特征,生成通顺的情绪回复;[EmoPrepend

1]提出了基于情绪情境的25K对话数据集,用来促进人机交流中除正确理解讨论内容之外的情绪感受问题;Zhaojiang Lin等人对于移情对话系统主要是集中在特定情绪下产生反应的问题,将理解用户的情绪以及生成适当的回答考虑进去,提出了一种新的端到端方法来建模对话系统中的共情:共情听众的混合物(MoEL);
[0006]Navonil Majumder等人针对同理心反应通常在不同程度上模仿用户情绪,而非统一对待情绪的特点,提出了MIME模型,以此来提升共情和反应的情境相关性;Qintong Li等人提出(EmpDG模型)使用粗粒度的对话级和细粒度的标记级情绪,来解决如何准确地捕捉到人类情绪的细微差别,并考虑到用户反馈的潜力,以产生更多的同情反应;Sahand Sabour等人在用户情绪识别的基础上,将用户情况的认知理解考虑到模型中,并提出了CEM模型,以此来增强生成反应中的共情表达;Qintong Li等人提出的KEMP模型针对缺乏外部知识会使得共情对话系统难以感知隐含隐情绪并从有限的对话历史中学习情绪交互问题,将NRC

VAD以及ConceptNet外部知识引入,以此来明确的理解和表达情绪。
[0007]上述研究很好的对对话系统中共情回复进行了提升,但并未考虑到词语的情绪倾向程度,因此不能更加精确的感知情绪。

技术实现思路

[0008]本专利技术提供一种人机共情对话方法、系统、电子设备和介质,解决对用户对话语句所表达的情绪进行更精确的感知,并生成更具共情的回复的技术问题。
[0009]本专利技术通过下述技术方案实现:
[0010]一种人机共情对话方法,包括:
[0011]S1、建立人机共情对话模型,所述人机共情对话模型包括情绪上下文编码器和情绪解码器;
[0012]S2、将历史对话数据输入至所述情绪上下文编码器中,得到所述历史对话数据对应的情绪上下文变量以及情绪信号,实现对所述历史对话数据表达的情绪进行更精确的感知;
[0013]S3、将所述情绪上下文变量以及情绪信号输入至情绪解码器中进行解码,最终得到针对该历史对话数据更具共情的回复。
[0014]作为优化,所述情绪上下文编码器包括KEMP编码器、情绪编码器和情绪感知模块,所述情绪解码器包括共享融合解码器、残差及其归一化层、多头交叉注意力网络、前馈神经网络及其归一化层。
[0015]作为优化,所述情绪编码器包括余弦相似度层、IDF算法层、用于融合余弦相似度层输出和IDF算法层输出的融合层以及对所述融合层输出进行编码的情绪倾向编码器;所述共享融合解码器包括与所述KEMP编码器的第一多头自注意力层共享多头自注意力参数的第二多头注意力层和多元残差网络层。
[0016]作为优化,S2的具体步骤为:
[0017]S2.1、将历史对话数据输入至所述KEMP编码器中,得到第一输出结果,同时,分别将所述历史对话数据输入至情绪编码器中的余弦相似度层,得到所述历史对话数据中的每个词语与每个情绪向量的情绪相关性;
[0018]S2.2、将所述历史对话数据中的每个词语输入至所述情绪编码器的IDF算法层,得到所述历史对话数据的每个词语的权重;
[0019]S2.3、将每个词语的情绪相关性与权重输入至情绪编码器的融合层中,得到每个词语的所有情绪倾向度,将每个词语的所有情绪倾向度输入至情绪倾向编码器中,得到第二输出结果;
[0020]S2.4、将第一输出结果与第二输出结果进行拼接,得到第三输出结果;
[0021]S2.5、将所述第三输出结果输入到所述情绪感知模块中,得到所述历史对话数据对应的情绪上下文变量以及情绪信号。
[0022]作为优化,S2.5中,所述情绪信号的计算过程为:
[0023]S2.5.1、通过下式得到情绪向量的大小:
[0024][0025]其中,η
i
表示对应的情绪强度,c
e
是一个h维大小的向量,表示第一多头注意力层的输出,的下标i=1,2...k,其中k为上下文概念网络中顶点的数量;
[0026]S2.5.2、使本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人机共情对话方法,其特征在于,包括:S1、建立人机共情对话模型,所述人机共情对话模型包括情绪上下文编码器和情绪解码器;S2、将历史对话数据输入至所述情绪上下文编码器中,得到所述历史对话数据对应的情绪上下文变量以及情绪信号,实现对所述历史对话数据表达的情绪进行更精确的感知;S3、将所述情绪上下文变量以及情绪信号输入至情绪解码器中进行解码,最终得到针对该历史对话数据更具共情的回复。2.根据权利要求1所述的一种人机共情对话方法,其特征在于,所述情绪上下文编码器包括KEMP编码器、情绪编码器和情绪感知模块,所述情绪解码器包括共享融合解码器、残差及其归一化层、多头交叉注意力网络、前馈神经网络及其归一化层。3.根据权利要求2所述的一种人机共情对话方法,其特征在于,所述情绪编码器包括余弦相似度层、IDF算法层、用于融合余弦相似度层输出和IDF算法层输出的融合层以及对所述融合层输出进行编码的情绪倾向编码器;所述共享融合解码器包括与所述KEMP编码器的第一多头自注意力层共享多头自注意力参数的第二多头注意力层和多元残差网络层。4.根据权利要求3所述的一种人机共情对话方法,其特征在于,S2的具体步骤为:S2.1、将历史对话数据输入至所述KEMP编码器中,得到第一输出结果,同时,分别将所述历史对话数据输入至情绪编码器中的余弦相似度层,通过将某一词语对应的某一情绪向量的情绪相关性减去历史对话数据中的所有词语与该情绪的余弦相似度的均值,得到所述历史对话数据中的该词语与该情绪向量的情绪相关性,并通过该步骤,得到所述历史对话数据中每个词语与每个情绪向量的情绪相关性;S2.2、将历史对话数据输入至所述KEMP编码器中,得到第一输出结果,同时,分别将所述历史对话数据输入至情绪编码器中的余弦相似度层,通过将某一词语对应的某一情绪向量的情绪相关性减去历史对话数据中的所有词语与该情绪的余弦相似度的均值,得到所述历史对话数据中的该词语与该情绪向量的情绪相关性,并通过该步骤,得到所述历史对话数据中每个词语与每个情绪向量的情绪相关性;S2.3、将每个词语的情绪相关性与权重输入至情绪编码器的融合层中,得到每个词语的所有情绪倾向度,然后将每个词语的所有情绪倾向度输入至情绪倾向编码器中,得到第二输出结果;S2.4、将第一输出结果与第二输出结果进行拼接,得到第三输出结果;S2.5、将所述第三输出结果输入到所述情绪感知模块中,得到所述历史对话数据对应的情绪上下文变量以及情绪信号。5.根据权利要求4所述的一种人机共情对话方法,其特征在于,S2.5中,所述情绪信号的计算过程为:S2.5.1、通过下式得到情绪向量的大小:其中,η
i
表示对应的情绪强度,c
e
是一个h维大小的向量,表示第一多头注意力层的输出,的下标i=1,2...k,其中k为上下文概念网络中顶点的数量;
S2.5.2、使用softmax线性层将情绪向量投影到情绪信号e
p
上;e
p
=W
e
c
e
;其中,W
e
为[32,h]大小的权重矩阵;S2.5.3、采用负对数似然估计作为情绪损失函数,以进行参数学习,其中,e
*
为真实的情绪分类,e表示预测的情绪分类,为对应的经情绪感知模块编码得到的情绪上下文...

【专利技术属性】
技术研发人员:熊倚平夏书银陈建促陈涛
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1