一种情感原因对提取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39148245 阅读:8 留言:0更新日期:2023-10-23 14:57
本发明专利技术提供一种情感原因对提取方法、装置、计算机设备和存储介质,所述方法包括:根据每个子句向量与相对应的词向量进行关联度计算、信息融合以及词向量对子句向量的贡献度计算,得到每个子句对应的目标子句向量;根据每个子句对应的目标子句向量建立子句之间相互关系的邻接矩阵,并从邻接矩阵中提取每个子句的语义信息;根据每个子句的语义信息计算出所有候选情感原因对的预测标签,并根据预测标签筛选出待提取文本中所有的情感原因对;本发明专利技术解决了现有技术中的情感原因对提取方法存在高误配率的问题,可以捕捉到子句与单词之间相互作用以及单词对子句向量表示的贡献程度,增强捕捉句子语义能力,提高了情感子句和原因子句配对准确性。句配对准确性。句配对准确性。

【技术实现步骤摘要】
一种情感原因对提取方法、装置、计算机设备和存储介质


[0001]本专利技术涉及情感分析
,具体涉及一种情感原因对提取方法、装置、计算机设备和存储介质。

技术介绍

[0002]情感分析是自然语言处理领域中的热门任务,先前对于情感分析的研究主要集中于情感分类任务。情感分类任务主要是对情感极性进行分类,但是随着自然语言处理技术的不断发展,仅对情感进行分类的任务已经不能够满足现实生活中的需求,所以研究者们将目光转向到研究情感背后的原因。随着互联网的发展与普及,人们在社交媒体上表达自己的情感和态度的行为越来越普遍,而对文本的情感分析有助于政府决策机构以及相关信息咨询机构有效的掌握社会舆情趋势;然而,了解一种情感的存在往往不足以预测未来的事件或做出最佳反应。但是,如果我们不仅知道情感的类型,还知道情感背后的原因,就能更可靠地预测未来事件或评估潜在影响。换句话说,当将人们的情绪视为一个事件时,情感与原因之间的因果关系就变得至关重要。对于个人而言,知道大众对某个产品或服务存在不同评价的潜在原因,有助于个人更全面地了解该产品或服务。对于政府而言,在大数据下综合分析群体对某事件或事物的评价,有助于提供更具针对性的社会服务。
[0003]传统的情感原因提取研究将该任务视为两个独立的子任务:情感分类和情感原因提取。前者识别一种情感的类别,后者检测一种情感的原因。这种分离的框架使每个子任务处理起来更加灵活,但忽略了两个子任务之间的相关性,即情感与原因是相互影响的。为了解决传统情感原因抽取任务的所存在的问题,情感原因对抽取(ECPE)任务被提出,旨在同时提取情感及其相关原因,并将它们配对。然而文本数据通常涉及复杂的语义关系,一个句子的语义通常是由句子中关键的词决定的,而现有技术中的情感原因对提取方法未能捕捉复杂的语义关系,在进行情感子句和原因子句配对时存在高误配率的问题。

技术实现思路

[0004]针对现有技术中所存在的不足,本专利技术提供的一种情感原因对提取方法、装置、计算机设备和存储介质,解决了现有技术中的情感原因对提取方法存在高误配率的问题,本专利技术可以捕捉到子句与单词之间相互作用以及单词对子句向量表示的贡献程度,增强捕捉句子语义能力,提高了情感子句和原因子句配对准确性。
[0005]第一方面,本专利技术提供一种情感原因对提取方法,所述方法包括:获取待提取文本中每个子句对应的子句向量和每个子句中包括的所有词向量;将所述每个子句向量与相对应的词向量进行关联度计算,得到每个子句对应的第一更新子句向量;将所述每个子句向量与相对应的第一更新子句向量进行信息融合,得到每个子句对应的第二更新子句向量;根据每个子句的子句向量、每个子句对应的第一更新子句向量和每个子句对应的第二更新子句向量进行词向量对子句向量的贡献度计算,得到每个子句对应的目标子句向量;根据每个子句对应的目标子句向量建立子句之间相互关系的邻接矩阵,并从所述邻接矩阵中通
过图卷积操作更新每个子句的语义信息;根据所述每个子句的语义信息计算出所有候选情感原因对的预测标签,并根据预测标签筛选出所述待提取文本中所有的情感原因对。
[0006]可选地,将所述每个子句向量与相对应的词向量进行关联度计算,得到每个子句对应的第一更新子句向量的计算公式为:
[0007][0008]其中,u
i
表示第i个子句向量,u
i

表示第i个子句对应的第一更新子句向量,v
ij
表示第i个子句中的第j个词向量,m
i
表示第i个子句对应词向量的数量,a
ij
和λ
ij
为中间值,α、W1、W2、W3、b1、b2和b3为可训练参数。
[0009]可选地,将所述每个子句向量与相对应的第一更新子句向量进行信息融合,得到每个子句对应的第二更新子句向量的计算公式为:
[0010][0011]其中,β
i
表示第i个子句对应的第二更新子句向量,W4、W5、b4和b5为可训练参数,表示级联操作。
[0012]可选地,根据每个子句的子句向量、每个子句对应的第一更新子句向量和每个子句对应的第二更新子句向量进行词向量对子句向量的贡献度计算,得到每个子句对应的目标子句向量的公式表达式为:
[0013][0014]其中,表示第i个子句对应的目标子句向量,σ为Sigmoid函数,ε为噪声参数,σ
i
表示中间值。
[0015]可选地,根据每个子句对应的目标子句向量建立子句之间相互关系的邻接矩阵的表达式为:
[0016][0017]其中,0<i,j≤n,n为待提前文本中子句数量,R表示邻接矩阵。
[0018]可选地,从所述邻接矩阵中提取每个子句的语义信息的公式表达式为:
[0019][0020]其中,l=2。
[0021]可选地,根据所述每个子句的语义信息计算出所有候选情感原因对的预测标签的
公式表达式为:
[0022][0023]其中,和为可训练参数。
[0024]第二方面,本专利技术提供一种情感原因对提取装置,所述装置包括:向量提取模块,用于获取待提取文本中每个子句对应的子句向量和每个子句中包括的所有词向量;信息融合模块,用于将所述每个子句向量与相对应的词向量进行关联度计算,得到每个子句对应的第一更新子句向量;将所述每个子句向量与相对应的第一更新子句向量进行信息融合,得到每个子句对应的第二更新子句向量;贡献度计算模块,用于根据每个子句的子句向量、每个子句对应的第一更新子句向量和每个子句对应的第二更新子句向量进行词向量对子句向量的贡献度计算,得到每个子句对应的目标子句向量;语义提取模块,用于根据每个子句对应的目标子句向量建立子句之间相互关系的邻接矩阵,并从所述邻接矩阵中通过图卷积操作更新每个子句的语义信息;情感原因对提取模块,用于根据所述每个子句的语义信息计算出所有候选情感原因对的预测标签,并根据预测标签筛选出所述待提取文本中所有的情感原因对。
[0025]第三方面,本专利技术实施例提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取待提取文本中每个子句对应的子句向量和每个子句中包括的所有词向量;将所述每个子句向量与相对应的词向量进行关联度计算,得到每个子句对应的第一更新子句向量;将所述每个子句向量与相对应的第一更新子句向量进行信息融合,得到每个子句对应的第二更新子句向量;根据每个子句的子句向量、每个子句对应的第一更新子句向量和每个子句对应的第二更新子句向量进行词向量对子句向量的贡献度计算,得到每个子句对应的目标子句向量;根据每个子句对应的目标子句向量建立子句之间相互关系的邻接矩阵,并从所述邻接矩阵中通过图卷积操作更新每个子句的语义信息;根据所述每个子句的语义信息计算出所有候选情感原因对的预测标签,并根据预测标签筛选出所述待提取文本中所有的情感原因对。
[0026]第四方面,本专利技术实施例提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种情感原因对提取方法,其特征在于,所述方法包括:获取待提取文本中每个子句对应的子句向量和每个子句中包括的所有词向量;将所述每个子句向量与相对应的词向量进行关联度计算,得到每个子句对应的第一更新子句向量;将所述每个子句向量与相对应的第一更新子句向量进行信息融合,得到每个子句对应的第二更新子句向量;根据每个子句的子句向量、每个子句对应的第一更新子句向量和每个子句对应的第二更新子句向量进行词向量对子句向量的贡献度计算,得到每个子句对应的目标子句向量;根据每个子句对应的目标子句向量建立子句之间相互关系的邻接矩阵,并从所述邻接矩阵中通过图卷积操作更新每个子句的语义信息;根据所述每个子句的语义信息计算出所有候选情感原因对的预测标签,并根据预测标签筛选出所述待提取文本中所有的情感原因对。2.如权利要求1所述的情感原因对提取方法,其特征在于,将所述每个子句向量与相对应的词向量进行关联度计算,得到每个子句对应的第一更新子句向量的计算公式为:其中,u
i
表示第i个子句向量,u
i

表示第i个子句对应的第一更新子句向量,v
ij
表示第i个子句中的第j个词向量,m
i
表示第i个子句对应词向量的数量,a
ij
和λ
ij
为中间值,α、W1、W2、W3、b1、b2和b3为可训练参数。3.如权利要求2所述的情感原因对提取方法,其特征在于,将所述每个子句向量与相对应的第一更新子句向量进行信息融合,得到每个子句对应的第二更新子句向量的计算公式为:其中,β
i
表示第i个子句对应的第二更新子句向量,W4、W5、b4和b5为可训练参数,表示级联操作。4.如权利要求1所述的情感原因对提取方法,其特征在于,根据每个子句的子句向量、每个子句对应的第一更新子句向量和每个子句对应的第二更新子句向量进行词向量对子句向量的贡献度计算,得到每个子句对应的目标子句向...

【专利技术属性】
技术研发人员:许文强
申请(专利权)人:重庆位图信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1