基于依赖类型和短语结构树的方面级情感分析方法及系统技术方案

技术编号:39244505 阅读:25 留言:0更新日期:2023-10-30 11:56
本发明专利技术公开了基于依赖类型和短语结构树的方面级情感分析方法及系统,其中方法,包括:获取待分类的句子和句子对应的方面词;将获取的数据,输入到训练后的方面级情感分析模型中,输出方面级情感分析结果;其中,方面级情感分析模型,用于:对待分类的句子和方面词进行编码,得到待分类的句子和方面词的上下文编码表示;基于上下文编码表示,分别构建依赖关系树和短语结构树;将依赖关系树对应的邻接矩阵,输入到图卷积神经网络中,得到依赖类型表示;将短语结构树对应的依赖矩阵,输入到语法编码器中,得到语法表示;将依赖类型表示、语法表示以及上下文编码表示进行拼接得到最终的表示;将最终的表示进行分类,得到不同情感极性的概率。性的概率。性的概率。

【技术实现步骤摘要】
基于依赖类型和短语结构树的方面级情感分析方法及系统


[0001]本专利技术涉及自然语言处理
,特别是涉及基于依赖类型和短语结构树的方面级情感分析方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]基于方面的情感分析又叫做方面级情感分析,方面级情感分析是一种细粒度的情感分类任务,旨在识别句子中具体方面的情感极性。图卷积网络最近被广泛应用于方面和意见词之间的关联建模,大多数研究通过依赖关系分析来利用词语关系,从而对上下文和方面词的分析提供更好的语义指导。然而,这些研究大多只是利用依赖关系,而没有考虑其依赖类型,缺乏有效的机制来区分重要关系。另一方面,由于依赖关系树的限制和在线评论的复杂性,依赖关系树可能提供不相关联的嘈杂信号,而且依赖关系树只能揭示词与词之间的关系,在大多数情况下无法模拟复杂的句子关系(如条件关系、并列关系、转折关系等),无法捕捉各方面的情感关系,即上下文间的情感关系。严重依赖于依赖关系树的方法在准确对齐表示情感的方面及其对应的词时存在挑战。...

【技术保护点】

【技术特征摘要】
1.基于依赖类型和短语结构树的方面级情感分析方法,其特征是,包括:获取待分类的句子和句子对应的方面词;将获取的数据,输入到训练后的方面级情感分析模型中,输出方面级情感分析结果;其中,方面级情感分析模型,用于:对待分类的句子和方面词进行编码,得到待分类的句子和方面词的上下文编码表示;基于上下文编码表示,分别构建依赖关系树和短语结构树;将依赖关系树对应的邻接矩阵,输入到图卷积神经网络中,得到依赖类型表示;将短语结构树对应的依赖矩阵,输入到语法编码器中,得到语法表示;将依赖类型表示、语法表示以及上下文编码表示进行拼接得到最终的表示;将最终的表示进行分类,得到不同情感极性的概率。2.如权利要求1所述的基于依赖类型和短语结构树的方面级情感分析方法,其特征是,训练后的方面级情感分析模型,其网络结构包括:依次连接的BERT模型,所述BERT模型的输出端与图卷积神经网络的输入端连接,所述BERT模型的输出端还与语法编码器的输入端连接;图卷积神经网络的输出端、语法编码器的的输出端和BERT模型的输出端,均与拼接单元的输入端连接,拼接单元的输出端与全连接层的输入端连接,全连接层的输出端输出不同情感极性的概率。3.如权利要求1所述的基于依赖类型和短语结构树的方面级情感分析方法,其特征是,所述基于上下文编码表示,分别构建依赖关系树和短语结构树,其中,依赖关系树的构建过程,包括:将每个词视为依赖关系树的节点;判断任意两个词之间是否存在对应的依赖类型,如果存在则表示两个节点之间存在相互连接的边;如果不存在依赖类型,则表示两个节点之间不存在相互连接的边。4.如权利要求1所述的基于依赖类型和短语结构树的方面级情感分析方法,其特征是,所述基于上下文编码表示,分别构建依赖关系树和短语结构树,其中,短语结构树的构建过程,包括:将每个词视为短语结构树的节点;判断任意两个单词是否属于同一个短语,如果是,则表示两个节点之间存在相互连接的边;如果否,则表示两个节点之间不存在相互连接的边。5.如权利要求1所述的基于依赖类型和短语结构树的方面级情感分析方法,其特征是,所述将依赖关系树对应的邻接矩阵,输入到图卷积神经网络中,得到依赖类型表示,具体包括:依赖类型表示依赖类型表示其中,σ是激活函数,W
l
是权重矩阵,b
l
是偏置项,e
ij
表示利用嵌入层将依赖类型矩阵映射的嵌入矩阵,表示由上一层GCN输出的依赖类型表示;其初始值为上下文编码器的输出,n表示GCN的层数。6.如权利要求1所述的基于依赖类型和短语结构树的方面级情感分析方法,其特征是,
所述将短语结构树对应的依赖矩阵,输入到语法编码器中,得到语法表示,具体包括:所述将短语结构树对应的依赖矩阵,输入到语法编码器中,得到语法表示,具体包括:所述将短语结构树对应的依赖矩阵,输入到语法编码器中,得到语法表示,具体包括:其中,是w
i
在l层的邻居节点集合,是w
i
...

【专利技术属性】
技术研发人员:刘祥志仪佳吴晓明
申请(专利权)人:齐鲁工业大学山东省科学院山东山科智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1