方面词情感分析方法技术

技术编号:39824532 阅读:5 留言:0更新日期:2023-12-29 15:59
本申请实施例涉及一种方面词情感分析方法

【技术实现步骤摘要】
方面词情感分析方法、装置、电子设备和计算机存储介质


[0001]本申请涉及人工智能
,具体涉及一种方面词情感分析方法

装置

电子设备和计算机存储介质


技术介绍

[0002]情感分析是自然语言处理的一项基础性任务,其中,基于方面的情感分析可以准确识别用户对某个方面的态度,对评论文本进行情感分析可以了解大众的消费喜好

对相关政策的态度以及互联网服务等方面的一些重要意见

因此,为了满足各项应用需求,对情感分析的准确性

及情感分析模型的繁琐程度和性能提出了更高的要求


技术实现思路

[0003]本申请实施例公开了一种方面词情感分析方法

装置

电子设备和计算机存储介质,能够准确对文本中的方面词进行分析,有效处理方面级情感分析任务,提高情感分析模型的性能

[0004]第一方面,本申请实施例公开了一种方面词情感分析方法,包括:
[0005]获取待分析文本对应的文本序列,以及所述待分析文本中包含的各个方面词对应的方面词序列;
[0006]通过情感分析模型对所述文本序列及所述各个方面词对应的方面词序列进行处理,基于双通道注意力机制生成所述各个方面词对应的目标特征向量,并根据所述各个方面词对应的目标特征向量确定所述各个方面词的情感极性;
[0007]其中,所述情感分析模型包括信息编码模块

双通道注意力模块

图卷积模块及分类层;所述信息编码模块用于提取所述文本序列对应的第一上下文特征,以生成所述文本序列对应的第一输出信息,提取第一方面词对应的方面词序列的第二上下文特征,以生成所述第一方面词对应的第二输出信息,提取所述文本序列的位置信息,根据所述位置信息对所述第一输出信息进行编码,得到第三输出信息;所述双通道注意力模块用于基于注意力机制,根据所述第一输出信息及所述第二输出信息生成第一方面注意力,并根据所述第二输出信息

所述第三输出信息及所述第一方面注意力生成第二方面注意力;所述图卷积模块用于基于图卷积通式,根据所述各个方面词的情感依赖情况以及所述第一方面词对应的第二方面注意力,生成所述第一方面词对应的目标特征向量;所述分类层用于根据所述第一方面词对应的目标特征向量,确定所述第一方面词的情感极性;所述第一方面词为所述待分析文本中的任一方面词

[0008]作为一种可选的实施方式,在本申请实施例的第一方面中,所述情感分析模型还包括词嵌入模块,所述词嵌入模块,用于对所述文本序列进行词性标注,得到所述文本序列对应的词性标注序列,将所述文本序列

所述词性标注序列及所述第一方面词对应的方面词序列分别进行编码,得到文本词向量

标注词向量及所述第一方面词对应的方面词向量,再对所述文本词向量和所述标注词向量进行嵌入,生成文本嵌入矩阵,以及对所述第一方
面词对应的方面词向量进行嵌入,生成方面词嵌入矩阵;
[0009]所述信息编码模块用于根据所述文本嵌入矩阵提取所述所述文本序列对应的第一上下文特征,以生成所述文本序列对应的第一输出信息,以及根据所述方面词嵌入矩阵提取所述第一方面词对应的方面词序列的第二上下文特征,以生成所述第一方面词对应的第二输出信息

[0010]作为一种可选的实施方式,在本申请实施例的第一方面中,所述信息编码模块包括双向长短记忆神经网络
Bi

LSTM
层;所述提取所述文本序列对应的第一上下文特征,以生成所述文本序列对应的第一输出信息,提取第一方面词对应的方面词序列的第二上下文特征,以生成所述第一方面词对应的第二输出信息,包括:
[0011]通过所述
Bi

LSTM
层,对所述文本序列进行上下文编码,确定所述文本序列上下文对应的前向输出和后向输出,根据所述文本序列上下文对应的前向输出和后向输出,生成含有所述文本序列对应的第一上下文特征的第一输出信息;
[0012]通过所述
Bi

LSTM
层,对所述第一方面词对应的方面词序列进行上下文编码,确定所述第一方面词对应的方面词序列上下文对应的前向输出和后向输出,根据所述方面词序列上下文对应的前向输出和后向输出,生成含有所述第一方面词对应的第二上下文特征的第二输出信息

[0013]作为一种可选的实施方式,在本申请实施例的第一方面中,所述信息编码模块还包括位置编码层,所述提取所述文本序列的位置信息,根据所述位置信息对所述第一输出信息进行编码,得到第三输出信息,包括:
[0014]根据所述文本序列中每个词对应的第一位置,以及所述第一方面词对应的第二位置,确定所述每个词相对于所述第一方面词的相对距离权重;
[0015]将所述每个词相对于所述第一方面词的相对距离权重与所述第一输出信息相乘,得到第三输出信息

[0016]作为一种可选的实施方式,在本申请实施例的第一方面中,所述第一方面词对应的第二输出信息包括所述第一方面词对应的方面词序列中包含的各个目标词对应的第一输出向量;所述基于注意力机制,根据所述第一输出信息及所述第二输出信息生成第一方面注意力,包括:
[0017]基于注意力机制,根据所述第一输出信息与各个所述目标词对应的第一输出向量进行指数运算,得到各个所述目标词对应的第一指数值;
[0018]计算各个所述目标词对应的第一指数值在所有目标词对应的第一指数值中的占比,得到各个所述目标词对应的第一注意力权重;
[0019]将各个所述目标词对应的第一注意力权重与对应的第一输出向量之积求和,得到所述第一方面词对应的第一方面注意力

[0020]作为一种可选的实施方式,在本申请实施例的第一方面中,所述第一方面词对应的第三输出信息包括所述第一方面词对应的方面词序列中包含的各个目标词对应的第二输出向量;所述根据所述第二输出信息

所述第三输出信息及所述第一方面注意力生成第二方面注意力,包括:
[0021]基于注意力机制,根据各个所述目标词对应的第二输出向量与所述第一方面词对应的第一方面注意力进行指数运算,得到各个所述目标词对应的第二指数值;
[0022]计算各个所述目标词对应的第二指数值在所有目标词对应的第二指数值中的占比,得到各个所述目标词对应的第二注意力权重;
[0023]将所述各个所述目标词对应的第二注意力权重与对应的第二输出信息之积求和,得到所述第一方面词对应的第二方面注意力

[0024]作为一种可选的实施方式,在本申请实施例的第一方面中,所述基于图卷积通式,根据所述各个方面词的情感依赖情况以及所述第一方面词对应的第二方面注意力,生成所述第一方面词对应的目标特征向量,包括:
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种方面词情感分析方法,其特征在于,所述方法包括:获取待分析文本对应的文本序列,以及所述待分析文本中包含的各个方面词对应的方面词序列;通过情感分析模型对所述文本序列及所述各个方面词对应的方面词序列进行处理,基于双通道注意力机制生成所述各个方面词对应的目标特征向量,并根据所述各个方面词对应的目标特征向量确定所述各个方面词的情感极性;其中,所述情感分析模型包括信息编码模块

双通道注意力模块

图卷积模块及分类层;所述信息编码模块用于提取所述文本序列对应的第一上下文特征,以生成所述文本序列对应的第一输出信息,提取第一方面词对应的方面词序列的第二上下文特征,以生成所述第一方面词对应的第二输出信息,提取所述文本序列的位置信息,根据所述位置信息对所述第一输出信息进行编码,得到第三输出信息;所述双通道注意力模块用于基于注意力机制,根据所述第一输出信息及所述第二输出信息生成第一方面注意力,并根据所述第二输出信息

所述第三输出信息及所述第一方面注意力生成第二方面注意力;所述图卷积模块用于基于图卷积通式,根据所述各个方面词的情感依赖情况以及所述第一方面词对应的第二方面注意力,生成所述第一方面词对应的目标特征向量;所述分类层用于根据所述第一方面词对应的目标特征向量,确定所述第一方面词的情感极性;所述第一方面词为所述待分析文本中的任一方面词
。2.
根据权利要求1所述的方法,其特征在于,所述情感分析模型还包括词嵌入模块,所述词嵌入模块,用于对所述文本序列进行词性标注,得到所述文本序列对应的词性标注序列,将所述文本序列

所述词性标注序列及所述第一方面词对应的方面词序列分别进行编码,得到文本词向量

标注词向量及所述第一方面词对应的方面词向量,再对所述文本词向量和所述标注词向量进行嵌入,生成文本嵌入矩阵,以及对所述第一方面词对应的方面词向量进行嵌入,生成方面词嵌入矩阵;所述信息编码模块用于根据所述文本嵌入矩阵提取所述所述文本序列对应的第一上下文特征,以生成所述文本序列对应的第一输出信息,以及根据所述方面词嵌入矩阵提取所述第一方面词对应的方面词序列的第二上下文特征,以生成所述第一方面词对应的第二输出信息
。3.
根据权利要求1所述的方法,其特征在于,所述信息编码模块包括双向长短记忆神经网络
Bi

LSTM
层;所述提取所述文本序列对应的第一上下文特征,以生成所述文本序列对应的第一输出信息,提取第一方面词对应的方面词序列的第二上下文特征,以生成所述第一方面词对应的第二输出信息,包括:通过所述
Bi

LSTM
层,对所述文本序列进行上下文编码,确定所述文本序列上下文对应的前向输出和后向输出,根据所述文本序列上下文对应的前向输出和后向输出,生成含有所述文本序列对应的第一上下文特征的第一输出信息;通过所述
Bi

LSTM
层,对所述第一方面词对应的方面词序列进行上下文编码,确定所述第一方面词对应的方面词序列上下文对应的前向输出和后向输出,根据所述方面词序列上下文对应的前向输出和后向输出,生成含有所述第一方面词对应的第二上下文特征的第二输出信息
。4.
根据权利要求3所述的方法,其特征在于,所述信息编码模块还包括位置编码层,所
述提取所述文本序列的位置信息,根据所述位置信息对所述第一输出信息进行编码,得到第三输出信息,包括:根据所述文本序列中每个词对应的第一位置,以及所述第一方面词对应的第二位置,确定所述每个词相对于所述第一方面词的相对距离权重;将所述每个词相对于所述第一方面词的相对距离权重与所述第一输出信息相乘,得到第三输出信息
。5.
根据权利要求1所述的方法,其特征在于,所述第一方面词对应的第二输出信息包括所述第一方面词对应的方面词序列中包含的...

【专利技术属性】
技术研发人员:赵文博肖清许程冲吕召彪
申请(专利权)人:联通广东产业互联网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1