一种对话情绪识别分类方法技术

技术编号:38332723 阅读:15 留言:0更新日期:2023-07-29 09:15
本发明专利技术提出一种对话情绪识别分类方法,包括对对话情绪识别数据集进行预处理;对预处理后的对话情绪识别数据集中的语句进行语句级特征提取,得到语句级特征;对预处理后的对话情绪识别数据集中的语句进行情绪引发事件提取,得到情绪引发事件的语义表示;通过语句的语句级特征和情绪引发事件的语义表示构建情绪

【技术实现步骤摘要】
一种对话情绪识别分类方法


[0001]本专利技术属于智能识别
,具体公开了一种对话情绪识别分类方法。

技术介绍

[0003]自然语言作为人类主要的交流媒介,在情感产生过程中起着非常重要的作用,因此,情感识别在意见挖掘、社交媒体、推荐系统等领域具有广阔的应用前景。近年来,为了开发能够理解人类情感的人工智能,会话情感识别(ERC)引起了自然语言处理研究者的关注,成为了一个热门的研究领域。会话情感识别旨在识别对话中每个话语的情绪,这有助于生成情绪感知对话,并开发用于心理治疗的共情对话代理或聊天机器人。此外,ERC在社交媒体线索、辩论挖掘、实时对话中的消费者反馈、法律裁决、电子健康服务医疗系统、教育等方面也有潜在的应用。会话情感识别不同于句子、文档等传统文本,它不仅需要话语本身的语义信息,还需要每个话语的语境建模。会话情绪识别的初步研究,如基于词汇和基于深度学习的情绪识别研究方法,忽略了会话的具体因素,如上下文线索、话语的时间顺序或说话人的具体信息。最近关于会话情绪识别的研究使用基于序列或基于图的方法来尽可能地模拟话语的上下文和说话者之间的互动。在上述研究的基础上,有研究者将常识知识、心理学知识、对话行为、话题等影响对话情绪的变量纳入模型。
[0004]尽管之前的研究在会话情绪识别任务上取得了巨大的进展,但是忽略了引发说话者产生情绪的心理表征对情绪识别的作用。使用外部常识知识库的方法建模心理状态很大程度上依赖知识库的规模、覆盖范围和构造质量。虽然预训练模型有助于对知识库的未见事件生成常识知识,但是现实生活中每个人的常识未必一样。心理学专家Rainer Reisenzein从可计算的情绪的心理表征理论来研究语言

情绪的相互作用,了解到情绪不仅依赖于认知心理表征(即认知或信息状态),而且依赖于动机心理表征(即动机状态)。可以说,可计算的情绪的心理表征理论所基于的情感心理表征理论本身就是对语言中隐含的情感常识心理学的解释。人类有复杂的心理表征,在日常对话交流中从言语可以得知说话者“某个心理表征刚刚被某个事件所证实”或“某个心理表征刚刚被某一事件所实现”,所以针对事务状态的情绪源于对心理表征的确认或不确认和心理表征的满足或挫败。可以说,心理表征和情感不仅作为因果关系,而且在语义上与情感有关:相信p、对p的渴望和关于p的快乐是一个共同的事件,它们都涉及到p。因此一个基于情绪的心理表征理论的含有语句、说话者、情绪引发事件的异构图神经网络对语句进行情绪分类方法可以更好的识别对话中的情绪。

技术实现思路

[0005]本专利技术为解决现有对话情绪识别分类方法忽略了引发说话者产生情绪的心理表征对情绪识别的作用且分类精度低的问题,提出了一种对话情绪识别分类方法。
[0006]本专利技术提供了一种对话情绪识别分类方法,包括如下步骤:
[0007]S1.对对话情绪识别数据集进行预处理,去除所述对话情绪识别数据集中语句的
无关信息,提高文本的质量;
[0008]S2.对步骤S1中预处理后的所述对话情绪识别数据集中的语句进行语句级特征提取,得到语句的语句级特征;
[0009]S3.对步骤S1中预处理后的所述对话情绪识别数据集中的语句进行情绪引发事件提取,得到情绪引发事件的语义表示;
[0010]S4.通过步骤S2获得的语句的语句级特征和步骤S3获得的所述情绪引发事件的语义表示构建情绪

心理表征异构会话图,得到每个节点输入特征的特征矩阵和节点之间边的连接关系的邻接矩阵;
[0011]S5.通过图编码器对步骤S4获得的所述特征矩阵和邻接矩阵进行会话级特征提取,得到会话级特征;
[0012]S6.全连接步骤S2中得到的所述语句级特征和步骤S5中得到的所述会话级特征,把全连接得到的结果输入到前馈神经网络得到情绪分类。
[0013]更进一步的,所述步骤S1中,所述对话情绪识别数据集包括IEMOCAP、DailyDialog、MELD和EmoryNLP中的一个或多个;所述预处理包括去除缩写、去除非字母符号、去除特殊符号、去除专有名词的缩写和去除多余的空格符中的一个或多个。
[0014]更进一步的,所述步骤S2中,使用语言模型Roberta

Large对所述对话情绪识别数据集中的语句进行语句级特征提取,在所述对话情绪识别数据集中的每个语句u
i
的开头加标记[CLS],使输入的序列为[CLS],w1,w2,
···
,w
L
并输入到Roberta中,得到语句级特征如公式(1)所示:
[0015][0016]其中,w
L
表示语句u
i
的第L个单词。
[0017]更进一步的,所述步骤S2中使用的语言模型Roberta

Large架构为24层,每个块中有16个自注意头,隐藏维度为1024,总共有355M个参数。
[0018]更进一步的,所述步骤S3包括:
[0019]S301.根据从属连词和连接词将所述对话情绪识别数据集中的语句分割成简单的子句;
[0020]S302.设计多个事件模式来匹配提取情绪引发事件,找到句子u
i
中包含每个动词v的简单子句的依赖关系,然后将依赖关系与设计好的多个事件模式一一匹配,对于每个模式,将动词v作为起点,找到所有积极依赖关系边,这些积极依赖关系边和由这些积极依赖关系边连接起来的单词为潜在的边和有效情绪引发事件的单词;
[0021]S303.通过依赖关系添加可选依赖关系边和由这些可选依赖关系边连接起来的单词形成依赖图;
[0022]S304.检查是否能够在依赖图中找到消极依赖关系边,若没有找到,则保留当前的依赖关系边和单词作为有效的情绪引发事件,反之则不保留;
[0023]S305.对提取的有效的情绪引发事件使用RoBERTa进行编码,获取最后一层隐藏状态的最大池化,得到情绪引发事件的语义表示如公式(2)所示:
[0024][0025]其中,e为有效的情绪引发事件。
[0026]更进一步的,所述步骤S4包括:
[0027]S401.构建情绪

心理表征异构会话图的语句节点、说话者节点和情绪引发事件节点;将对话中的每个目标语句作为一个语句节点,语句节点的特征初始化为语句的语句级特征,如公式(3)所示:
[0028][0029]将对话中每个说话者作为一个说话者节点,说话者节点的特征初始化为对话中该说话者所有表达的语句的语义特征平均值,如公式(4)所示:
[0030][0031]其中,avg()为取平均值函数;
[0032]将从对话中每个语句提取出来的情绪引发事件作为一个情绪引发事件节点,情绪引发事件节点的特征初始化如公式(5)所示:
[0033][0034]节点合集如公式(6)所示:
[0035]V=u
i
∪Unique(s
j...

【技术保护点】

【技术特征摘要】
1.一种对话情绪识别分类方法,其特征在于,包括如下步骤:S1.对对话情绪识别数据集进行预处理,去除所述对话情绪识别数据集中语句的无关信息;S2.对步骤S1中预处理后的所述对话情绪识别数据集中的语句进行语句级特征提取,得到语句的语句级特征;S3.对步骤S1中预处理后的所述对话情绪识别数据集中的语句进行情绪引发事件提取,得到情绪引发事件的语义表示;S4.通过步骤S2获得的语句的语句级特征和步骤S3获得的所述情绪引发事件的语义表示构建情绪

心理表征异构会话图,得到每个节点输入特征的特征矩阵和节点之间边的连接关系的邻接矩阵;S5.通过图编码器对步骤S4获得的所述特征矩阵和邻接矩阵进行会话级特征提取,得到会话级特征;S6.全连接步骤S2中得到的所述语句级特征和步骤S5中得到的所述会话级特征,把全连接得到的结果输入到前馈神经网络得到情绪分类。2.根据权利要求1所述的一种对话情绪识别分类方法,其特征在于,所述步骤S1中,所述对话情绪识别数据集包括IEMOCAP、DailyDialog、MELD和EmoryNLP中的一个或多个;所述预处理包括去除缩写、去除非字母符号、去除特殊符号、去除专有名词的缩写和去除多余的空格符中的一个或多个。3.根据权利要求1所述的一种对话情绪识别分类方法,其特征在于,所述步骤S2中,使用语言模型Roberta

Large对所述对话情绪识别数据集中的语句进行语句级特征提取,在所述对话情绪识别数据集中的每个语句u
i
的开头加标记[CLS],使输入的序列为[CLS],w1,w2,
···
,w
L
并输入到Roberta中,得到语句级特征如公式(1)所示:其中,w
L
表示语句u
i
的第L个单词。4.根据权利要求3所述的一种对话情绪识别分类方法,其特征在于,所述步骤S2中使用的语言模型Roberta

Large架构为24层,每个块中有16个自注意头,隐藏维度为1024,总共有355M个参数。5.根据权利要求3所述的一种对话情绪识别分类方法,其特征在于,所述步骤S3包括:S301.根据从属连词和连接词将所述对话情绪识别数据集中的语句分割成简单的子句;S302.设计多个事件模式来匹配提取情绪引发事件,找到句子u
i
中包含每个动词v的简单子句的依赖关系,然后将依赖关系与设计好的多个事件模式一一匹配,对于每个模式,将动词v作为起点,找到所有积极依赖关系边,这些积极依赖关系边和由这些积极依赖关系边连接起来的单词为潜在的边和有效情绪引发事件的单词;S303.通过依赖关系添加可选依赖关系边和由这些可选依赖关系边连接起来的单词形成依赖图;S304.检查是否能够在依赖图中找到消极依赖关系边,若没有找到,则保留当前的依赖关系边和单词作为有效的情绪引发事件,反之则不保留;
S305.对提取的有效的情绪引发事件使用RoBERTa进行编码,获取最后一层隐藏状态的最大池化,得到情绪引发事件的语义表示如公式(2)所示:其中,e为有效的情绪引发事件。6.根据权利要求5所述的一种对话情绪识别分类方法,其特征在于,所述步骤S4包括:S401.构建情绪

心理表征异构会话图的语句节点、说话者节点和情绪引发事件节点;将对话中的每个目标语句作为一个语句节点,语句节点的特征初始化为语句的语句级特征,如公式(3)所示:将对话中每个说话者作为一个说话者节点,说话者节点的特征初始化为对话中该说话者所有表达的语句的语义特征平均值,如公式(4)所示:其中,avg()为取平均值函数;将从对话中每个语句提取出来的情绪引发事件作为一个情绪引发事件节点,情绪引发事件节点的特征初始化如公式(5)所示:节点合集如公式(6)所示:V=u
i
∪Unique(s
j
)∪Unique(e
y
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中,V为节点合集,u
i
为第i个语句节点,s
j
为第j个说话者节点,e
y
为第y个情绪引发事件节点,Unique()为去重函数;S402.构建情绪

心理表征异构会话图的语句—语句边、语句—说话者边和语句—情绪引发事件边;连接每个目标语句和它之前所有说话者的最后一个语句,所述语句—语句边建模过去语句对当前语句的影响,所述语句—语句边E
uu

【专利技术属性】
技术研发人员:徐博李龙娇
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1