基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质技术

技术编号:30441987 阅读:34 留言:0更新日期:2021-10-24 18:30
本申请公开了一种基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质,属于自然语言处理技术领域。解决了现有Emotion Recognition in Conversation(ERC)模型忽视了话语和知识的直接交互;使用与主任务弱相关的辅助任务,只能为ERC任务提供有限的情感信息的问题。本申请利用一个大规模知识图谱中的常识知识来增强词级别表示。使用一个自匹配模块整合知识表示和话语表示,允许二者进行复杂交互。将短语级别的情感极性强度预测任务作为辅助任务。该辅助任务的标签来自情感词典的情感极性强度值,明显与ERC任务高度相关,为目标话语的情绪感知提供了直接指导信息。知提供了直接指导信息。知提供了直接指导信息。

【技术实现步骤摘要】
基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质


[0001]本申请涉及一种对话情绪识别网络模型、构建方法、电子设备及存储介质,尤其涉及一种基于双重知识交互和情感极性强度感知多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质,属于自然语言处理


技术介绍

[0002]由于公开可获取对话数据的爆炸式增长,对话情绪识别在最近几年引起了自然语言处理领域的广泛关注。对话情绪识别旨在识别对话中每一个话语的情感,这个任务要求机器理解对话中情绪表达的方式。由于ERC模型能够使机器理解人类对话中的情感,进而使得机器生成情绪连贯的回复,因此ERC任务拥有广泛的应用领域,例如社交媒体分析和对话生成。
[0003]与普通句子级别的情绪识别不同,对话语境建模对于ERC任务是非常关键的。早期基于循环神经网络的ERC工作采用记忆网络来存储对话历史信息。考虑到ERC任务需要对对话参与者之间的交互进行建模,很多工作采用基于循环神经网络(RNN)对对话中的话语进行序列建模,例如文献Devamanyu Hazarika,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于双重知识交互和多任务学习的对话情绪识别网络模型,其特征在于,包括:任务定义模块,用于给定对话数据集中一个对话的集合,在给定对话历史信息的情况下,预测每一个目标话语的情绪标签;编码器,采用XLNet编码器建模对话历史信息;知识整合模块,用于常识知识的抽取,并基于图注意力网络得到知识增强表示;自匹配模块,用于话语

知识间的交互;对话情绪识别模块,结合对话历史信息预测当前目标话语的情绪标签;情感极性强度预测任务模块,用于向模型中引入与主任务强相关的知识,并利用多任务学习的设置来结合主任务和辅助任务。2.基于双重知识交互和多任务学习的对话情绪识别网络模型构建方法,其特征在于,包括:步骤一,给定对话数据集中一个对话的集合,在给定对话历史信息的情况下,预测每一个目标话语的情绪标签;步骤二,采用XLNet编码器建模对话历史信息;步骤三,常识知识的抽取,并基于图注意力网络得到知识增强表示;步骤四,基于自注意力机制的自匹配模块实现话语

知识间的交互;步骤五,对话情绪识别任务,结合对话历史信息预测当前目标话语的情绪标签;步骤六,情感极性强度预测任务,向模型中引入与主任务强相关的知识,并利用多任务学习的设置来结合主任务和辅助任务;所述方法是基于权利要求1所述的对话情绪识别网络模型实现的。3.根据权利要求2所述的基于双重知识交互和多任务学习的对话情绪识别网络模型构建方法,其特征在于,所述步骤一中,将对话情绪识别任务定义如下:给定其中,i=1,...,N,j=1,...,N
i
,代表对话数据集中一个对话对{话语,标签}的集合;对话X中包含N个话语,每一个话语X
i
中包含N
i
个词,表示为每一个X
i
由p(X
i
)∈P发出,其中,P是说话者的集合;离散值Y
i
∈S被用来表示情绪标签,其中S表示情绪标签的集合,并且|S|=h
c
,其中h
c
是预定义情绪的数量;对话情绪识别任务的目标是在给定对话历史信息的情况下预测每一个目标话语X
i
的情绪标签Y
i
。4.根据权利要求3所述的基于双重知识交互和多任务学习的对话情绪识别网络模型构建方法,其特征在于,所述步骤二中,使用XLNet获取词表示,对于时刻i,在当前话语X
i
之前添加符号“[CLS]”来表示话语的开始:此后x
i
通过编码层:其中D
h
表示XLNet

base的输入维度,embedding表示获取相应初始词向量的编码操作;编码层的输出被当作XLNet第一层的输入状态;得到输入状态之后,采用L层Transformer结构进行词级别的编码,其中L是一个超参数;遵循XLNet的设置,每个自注意力层都利用片段级递归机制实现上一时刻i

1的语境记忆m
i
‑1的整合;利用公式(2)表示:
其中其中是词级别的话语表示,D
m
是预定义的最大记忆长度,encoder表示编码过程。5.根据权利要求4所述的基于双重知识交互和多任务学习的对话情绪识别网络模型构建方法,其特征在于,所述步骤三中,使用ConceptNet作为模型中的常识知识库;首先常识知识库的知识抽取过程如下:对于词t,根据其在ConceptNet中的邻居节点抽取其相应子图g
t
;对于g
t
,丢弃停用词或者不在编码层词典V中的概念,并移除置信分数小于1的断言以降低噪声的影响;g
t
={(c1,ω1),(c2,ω2),...,(c
k

k
)},其中c
i
表示t的第i个相连的概念,ω
i
表示二者间的置信分数;然后采用图注意力机制获取知识表示,根据所述知识抽取过程,对于每一个非停用词获得其概念图对于和c
p
表示对应概念子图中的任意邻居节点,通过公式(1)中的编码层获得其表示和用...

【专利技术属性】
技术研发人员:孙承杰解云鹤刘秉权季振洲刘远超单丽莉林磊
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1