【技术实现步骤摘要】
基于跨度共享和语法依存关系增强的情感三元组抽取方法
[0001]本专利技术涉及情感分析
,具体地说,涉及一种基于跨度共享和语法依存关系增强的情感三元组抽取方法。
技术介绍
[0002]方面级情感分析是自然语言处理中的一个重要领域,其涉及到的核心对象为方面术语和观点术语。在评论句中,方面术语通常为被描述的属性或实体,其所表达的情感通常由观点术语来表示。目前,大多数方法是将方面级情感分析任务分解成多个独立的子任务来解决,如方面术语提取(AE),其目标是提取出一个句子中的所有方面术语。此外,观点术语抽取(OE)通常依赖给定的方面术语进行观点术语提取。然而,这些方法需要以流水线的方式组合在一起才能解决一个完整的ABSA任务,这种方式容易产生错误传播,并忽略方面术语和观点术语之间的依赖关系。
[0003]子任务间存在的依赖关系使得目前的研究重点转向了联合提取。在联合提取任务中,具有代表性的工作是方面
‑
观点术语的成对提取任务(Pair),其目的是完成成对的方面术语和观点术语的提取。然而,这种成对抽取忽略了它们之间的情感表达关系,依然无法完整地解决方面及情感分析任务。
[0004]与上述所提到的子任务不同,情感三元组的抽取任务可以完整地解决方面级情感分析任务。然而由于这项任务需要提取方面术语和观点术语以及对应的情感表达,所以这项任务具有很大的挑战性。
技术实现思路
[0005]本专利技术的内容是提供一种基于跨度共享和语法依存关系增强的情感三元组抽取方法,其能够克服现有技术的 ...
【技术保护点】
【技术特征摘要】
1.基于跨度共享和语法依存关系增强的情感三元组抽取方法,其特征在于:包括以下步骤:一、通过编码器层获得特征表示;二、通过依赖图神经网络层增强语义表示;三、生成跨度并对过滤掉无效跨度;四、通过情感分类器完成分类。2.根据权利要求1所述的基于跨度共享和语法依存关系增强的情感三元组抽取方法,其特征在于:步骤一中,选择BERT双向编码表征作为核心主干来学习上下文语义的表示;给定一个输入句子S,在句子的开头添加cls全局上下文语义表征,在句子的末尾添加[SEP]句子结束标记,然后将序列S
x
={x
cls
,x1,...x
i
,...,x
n
,x
sep
}输入到BERT模型中;这些单词输入到BERT模型中得到单词的嵌入序列最后,得到输出的hidden layer隐藏层表示特征layer隐藏层表示特征其中BERT(*)是cased
‑
base
‑
BERT模型,hidden layer隐藏层为12层。3.根据权利要求2所述的基于跨度共享和语法依存关系增强的情感三元组抽取方法,其特征在于:步骤二中,使用Standford
‑
NLP工具来获得评论语句的句法依存关系树,根据输入句子的依存关系树的连接情况将依存关系树转化为一个M阶图结构,其中节点表示每一个词,边表示词之间的关系;M阶图结构可以表示为N*N的邻接矩阵A
ij
;当两个单词节点之间存在连接或者是单词本身时,将相应的邻接矩阵的值设置为1;否则,将其设置为0;公式如下:得到相应的邻接矩阵后,将其输入到GCN图卷积网络中;对于l层的节点i,特征表示作为输入,输出具有方面词和意见词之间的特征表示,定义如下:其中RELU为线性整流函数,W
l
是GCN第l层的训练权重,b
l
是当前权重的偏移值。4.根据权利要求3所述的基于跨度共享和语法依存关系增强的情感三元组抽取方法,其特征在于:步骤三中,将输出和BERT输出的隐藏层表示特征进行拼接,然后通过跨度生成器将h
j
映射到不同的跨度;跨度Sp
i
={Index
start
,Index
start 1
,
…
,Index
end
}中的Index
start
表示索引的开始,Index
end
表示索引的结束;Index
end
‑
Index
start
≤L
s
,其中L
s
是跨度长度;引入词嵌入E
k
,并为每个跨度分配了一个固定大小的嵌入,其中...
【专利技术属性】
技术研发人员:李优,林涌东,常亮,林煜明,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。