基于句法特征和注意力机制相融合的情感分析系统及方法技术方案

技术编号:32513062 阅读:17 留言:0更新日期:2022-03-02 11:02
本发明专利技术公开了自然语言处理技术领域的基于句法特征和注意力机制相融合的情感分析系统及方法,包括:获取文本数据,进行数据集分类;基于分类后的文本数据进行词向量嵌入表示转化后,利用双向长短期记忆网络提取初始上下文特征;将初始上下文特征输入到图卷积网络后,结合局部平均池化提取句法特征;将初始上下文特征进行位置编码后输入到注意力模型后,结合全局最大池化提取全局特征;基于句法特征和全局特征进行向量拼接后,输入全连接层和随机失活层,获得情感分类的最终结果。本发明专利技术同时考虑了文本的句法信息、位置信息和语义信息,能够有效提高情感分类的准确性。能够有效提高情感分类的准确性。能够有效提高情感分类的准确性。

【技术实现步骤摘要】
基于句法特征和注意力机制相融合的情感分析系统及方法


[0001]本专利技术涉及基于句法特征和注意力机制相融合的情感分析系统及方法,属于自然语言处理


技术介绍

[0002]随着互联网与大数据时代的到来,博客、微博等社交媒体、电商平台与各种新闻网站已经成为人们日常表达情感与获取信息的重要平台,从而也产生了海量的带有个人情感倾向的文本数据;方面级情感分析是针对文本中不同的方面词进行分析,是对文本情感分析的更深层次的研究。
[0003]基于手工特征和传统机器学习方法的复杂度高、工作量大且效率低;基于深度学习和神经网络的分类模型,如卷积神经网络、循环神经网络、注意力机制等不能够同时有效的利用文本中的句法信息、位置信息和语义信息,而使用Bert等模型具有耗时长、效率低的缺陷,为解决现有技术的不足,本专利技术提出了基于句法特征和注意力机制相融合的方面级情感分析方法,通过实验验证了在方面级文本情感分析准确率上具有更好的效果,具有一定的推广意义。

技术实现思路

[0004]本专利技术的目的在于克服现有技术中的不足,提供基于句法特征和注意力机制相融合的情感分析系统及方法,可以同时利用文本的句法信息、位置信息和语义信息的方面级情感分析方法,提高了方面级文本情感分析的准确率。
[0005]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0006]第一方面,本专利技术提供了基于句法特征和注意力机制相融合的情感分析方法,包括:
[0007]获取文本数据,进行数据集分类;
[0008]基于分类后的文本数据进行词向量嵌入表示转化后,利用双向长短期记忆网络提取初始上下文特征;
[0009]将初始上下文特征输入到图卷积网络后,结合局部平均池化提取句法特征;
[0010]将初始上下文特征进行位置编码后输入到注意力模型后,结合全局最大池化提取全局特征;
[0011]基于句法特征和全局特征进行向量拼接后,输入全连接层和随机失活层,获得情感分类的最终结果。
[0012]进一步的,获取文本数据,进行数据集分类,包括:
[0013]通过获取网上公开的数据集来构建数据样本,将数据样本按照7:3的比例划分为训练集和测试集。
[0014]进一步的,将初始上下文特征输入到图卷积网络后,结合局部平均池化提取句法特征,包括:
[0015]将初始上下文特征输入图卷积网络中,利用图卷积网络捕捉方面词与相邻单词的句法关系,获得一层句法特征;
[0016]通过设置门控机制对一层句法特征进行特征选择,筛选出一层重要句法特征;
[0017]将一层重要句法特征作为输入,重新输入图卷积网络中进行特征选择,获得最终重要句法特征;
[0018]将最终重要句法特征除方面词之外的上下文特征置零;
[0019]基于置零后的最终重要句法特征进行平均池化操作获得句法特征。
[0020]进一步的,所述一层重要句法特征为:
[0021][0022]H2=H1·
G
[0023]其中,H1表示一层句法特征,H2表示一层重要句法特征,A表示文本数据的邻接矩阵,I表示单位矩阵,G表示筛选加权矩阵,表示(A+I)的度矩阵,W表示权重矩阵,b表示偏置。
[0024]进一步的,将初始上下文特征进行位置编码后输入到注意力模型后,结合全局最大池化提取全局特征,包括:
[0025]使用位置编码对所述初始上下文特征进行编码处理;
[0026]将编码处理后的结果输入到自注意力机制网络进行加权,获得注意力强化特征;
[0027]将注意力强化特征依次进行归一化处理和最大池化处理,获得全局特征。
[0028]第二方面,本专利技术提供了基于句法特征和注意力机制相融合的情感分析系统,包括:
[0029]分类模块:用于获取文本数据,进行数据集分类;
[0030]初始上下文特征提取模块:用于基于分类后的文本数据进行词向量嵌入表示转化后,利用双向长短期记忆网络提取初始上下文特征;
[0031]句法特征提取模块:用于将初始上下文特征输入到图卷积网络后,结合局部平均池化提取句法特征;
[0032]全局特征提取模块:用于将初始上下文特征进行位置编码后输入到注意力模型后,结合全局最大池化提取全局特征;
[0033]输出模块:基于句法特征和全局特征进行向量拼接后,输入全连接层和随机失活层,获得情感分类的最终结果。
[0034]第三方面,基于句法特征和注意力机制相融合的情感分析装置,包括处理器及存储介质;
[0035]所述存储介质用于存储指令;
[0036]所述处理器用于根据所述指令进行操作以执行根据上述任一项所述方法的步骤。
[0037]第四方面,计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
[0038]与现有技术相比,本专利技术所达到的有益效果:
[0039]本专利技术提出的基于句法特征和注意力机制相融合的情感分析系统及方法,使用增加门控机制的图卷积网络,能够有效提取文本的句法信息,并去除部分冗余;在自注意力机
制前嵌入位置编码,可以充分利用方面词的位置信息,自注意力机制可以缓解图卷积网络感受野受限的问题,从而有效预测文本方面级情感倾向。
附图说明
[0040]图1是本专利技术实施例一提供的基于句法特征和注意力机制相融合的方面级情感分析方法流程图;
[0041]图2是本专利技术实施例一提供的基于句法特征和注意力机制相融合的方面级情感分析方法模型结构图。
具体实施方式
[0042]下面结合附图对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0043]实施例一:
[0044]基于句法特征和注意力机制相融合的情感分析方法,包括以下步骤:
[0045]步骤1:通过获取网上公开的laptap数据集和restaurant数据集来构建数据样本,将数据样本按照7:3的比例划分为训练集和测试集,并进行预处理。laptap数据集和restaurant数据集是方面级文本情感分析领域比较权威的数据集,分别有3266和8838条文本数据。
[0046](1)将第一步获取的文本数据进行预处理操作,包括将文本数据转化为glove词向量嵌入表示,并利用双向长短期记忆网络提取初始上下文特征。预处理的目的是提取文本中的有效信息,使接下来的工作变得简单、高效。
[0047]步骤2:将步骤1所述初始上下文特征输入到图卷积网络,结合局部平均池化,聚合得到句法特征,具体分步骤如下:
[0048](1)将所述初始上下文特征输入第一层图卷积网络GCN中,利用GCN捕捉方面词与相邻单词的句法关系,获得一层句法特征H1。
[0049](2)通过设置门控机制对一层句法特征H1进行特征选择,筛选出一层重要句法特征H2。用A表示文本数据的邻接矩阵,I表示单位本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于句法特征和注意力机制相融合的情感分析方法,其特征是,包括:获取文本数据,进行数据集分类;基于分类后的文本数据进行词向量嵌入表示转化后,利用双向长短期记忆网络提取初始上下文特征;将初始上下文特征输入到图卷积网络后,结合局部平均池化提取句法特征;将初始上下文特征进行位置编码后输入到注意力模型后,结合全局最大池化提取全局特征;基于句法特征和全局特征进行向量拼接后,输入全连接层和随机失活层,获得情感分类的最终结果。2.根据权利要求1所述的基于句法特征和注意力机制相融合的情感分析方法,其特征是,获取文本数据,进行数据集分类,包括:通过获取网上公开的数据集来构建数据样本,将数据样本按照7:3的比例划分为训练集和测试集。3.根据权利要求1所述的基于句法特征和注意力机制相融合的情感分析方法,其特征是,将初始上下文特征输入到图卷积网络后,结合局部平均池化提取句法特征,包括:将初始上下文特征输入图卷积网络中,利用图卷积网络捕捉方面词与相邻单词的句法关系,获得一层句法特征;通过设置门控机制对一层句法特征进行特征选择,筛选出一层重要句法特征;将一层重要句法特征作为输入,重新输入图卷积网络中进行特征选择,获得最终重要句法特征;将最终重要句法特征除方面词之外的上下文特征置零;基于置零后的最终重要句法特征进行平均池化操作获得句法特征。4.根据权利要求3所述的基于句法特征和注意力机制相融合的情感分析方法,其特征是,所述一层重要句法特征为:H2=H1·
G其中,H1表示一层句法特征,H2表示一层重要句法特征...

【专利技术属性】
技术研发人员:刘峰王展帆赵峥涞
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1