当前位置: 首页 > 专利查询>福州大学专利>正文

融合图卷积神经网络的文本情感分类系统技术方案

技术编号:30367091 阅读:17 留言:0更新日期:2021-10-16 17:38
本发明专利技术涉及一种融合图卷积神经网络的文本情感分类系统。包括:数据预处理模块,用于构造用户与用户关系图和用户与产品关系图;评论文本预处理模块,用于对文档文本进行特征化处理;基于循环神经网络的编码模块,获取单词级别和句子级别的编码;基于图卷积神经网络的用户和产品特征提取模块,获取用户和产品的向量表示;用户产品记忆模块,获取具有代表性的用户和产品信息的向量表示;注意力机制模块,分别获取用户和产品的句子和文档表示向量;预测情感极性模块,利用分类函数得到最终的情感分类结果。本发明专利技术能够有效的学习用户与用户之间和产品与产品之间的内联关系,并通过用户层次和产品层次的分层注意力网络,最终识别出文本的情感类别。的情感类别。的情感类别。

【技术实现步骤摘要】
融合图卷积神经网络的文本情感分类系统


[0001]本专利技术涉及情感分析和观点挖掘领域,更具体地,涉及一种融合图卷积神经网络的文本情感分类系统。

技术介绍

[0002]文本情感分类通常指对在线评论的文本进行挖掘,分析用户对产品的情感态度,包括观点、看法、情绪、好恶、立场等主观信息,并对上述信息做出情感倾向类别的判断。近年来,随着网络普及以及社交网站、在线评论网站等迅速发展,文本情感分类成为研究者广泛关注的研究方向。
[0003]文本情感分类研究的主要分为基于情感词典的方法、基于传统机器学习的方法和基于神经网络的方法。
[0004]基于情感词典的文本情感分类,是指由不同情感词典提供的情感词的情感极性,来实现情感极性的划分。首先是文本输入,通过数据的预处理,接着进行分词操作,然后将情感词典中的不同类型和程度的词语放入模型最后根据情感判断规则将情感类型输出。基于情感词典的方法可以准确反映文本的非结构化特征。但这种方法,当情感词覆盖率和准确率高时,效果比较准确。随着信息的技术的高速发展,出现了越来越多的网络新词,原有的情感词典不能很好的解决。
[0005]基于传统机器学习的情感分析方法,是通过大量有标注或无标注语料,使用机器学习算法,抽取特征,最后进行情感分析输出结果。基于传统机器学习的情感分类主要在于情感特征的提取以及分类器的组合选择,不同分类器的组合选择对情感分析的结果有存在一定的影响,但这类方法不能充分利用上下文文本的语境信息,因此其分类准确性有一定的影响。
[0006]基于神经网络的情感分类方法,最近的研究表明,利用用户和产品信息能够有效地提升情感分类性能,所以现有的研究将用户和产品信息融入神经网络中。有研究人员在CNN情感分类器中引入了单词级别偏好矩阵和每个用户和产品的表示向量。该模型取得了一些改进,但是模型复杂度高,仅仅考虑了单次级别的用户和产品信息,而没有考虑语义级别。有研究人员将用户和产品的信息一起考虑,并通过注意力机制将它们融入到一个评论表示中。然而,在评论中,我们可以观察到一些词是用户的情感表示,一些词是表明产品的特征。所以评论中是具有来自用户和产品不同视角的不同潜在语义,因此,将用户和产品信息一起编码为一种评论表示是不合理的。有研究人员使用对用户和产品的单独关注来捕捉用户的喜好和产品的特征。但是如果限制了针对某个用户或者产品的评论数量,则模型就无法提取准确的信息,甚至会影响模型的精度。有研究人员考虑到了具有相似偏好的用户可以提供其他有用的信息,使用了一种存储有代表性的用户和产品的信息来补充自身信息,当用户或者产品的评论数量较少时,可以借助代表性用户的信息来进行情感分类。但是,仅仅考虑有代表性的用户和产品信息是不完整的。并且不是所有的用户和产品借助有代表性的用户和产品信息都是有效的。

技术实现思路

[0007]本专利技术的目的在于提供一种融合图卷积神经网络的文本情感分类系统,能够有效的学习用户与用户之间和产品与产品之间的内联关系,并通过用户层次和产品层次的分层注意力网络,最终识别出文本的情感类别。
[0008]为实现上述目的,本专利技术的技术方案是:一种融合图卷积神经网络的文本情感分类系统,包括:
[0009]一数据预处理模块,用于构造用户与用户关系图和用户与产品关系图;
[0010]一评论文本预处理模块,用于对文档文本进行特征化处理;
[0011]一基于循环神经网络的编码模块,获取单词级别和句子级别的编码;
[0012]一基于图卷积神经网络的用户和产品特征提取模块,获取用户和产品的向量表示;
[0013]一用户产品记忆模块,获取具有代表性的用户和产品信息的向量表示;
[0014]一注意力机制模块,分别获取用户和产品的句子和文档表示向量;
[0015]一预测情感极性模块,利用分类函数得到最终的情感分类结果。
[0016]在本专利技术一实施例中,所述数据预处理模块,根据文档中的用户信息、产品信息、标签信息,构造用户与用户关系图和用户与产品关系图。
[0017]在本专利技术一实施例中,所述评论文本预处理模块,利用SkipGram模型提取文本的语义向量。
[0018]在本专利技术一实施例中,所述基于循环神经网络的编码模块,利用双向LSTM对单词和句子进行编码,捕捉单词和句子的上下文信息,获取单词级别和句子级别的编码。
[0019]在本专利技术一实施例中,所述基于图卷积神经网络的用户和产品特征提取模块,利用图卷积神经网络对用户与用户关系图和用户与产品关系图建模,学习用户与用户、产品与产品间的内在联系,并作为用户、产品的向量表示。
[0020]在本专利技术一实施例中,所述用户产品记忆模块,使用两个k维矩阵分别用来存储具有代表性的用户和产品信息,并使用一种门机制更新矩阵。
[0021]在本专利技术一实施例中,所述注意力机制模块,利用用户层次和产品层次注意力机制提取句子中重要单词和文档中的重要句子,从而得到句子和文档表示。
[0022]在本专利技术一实施例中,所述预测情感极性模块,采用SoftMax函数对所得到的文档表示向量进行处理,预测各文本的情感类别。
[0023]在本专利技术一实施例中,在模型的训练阶段,根据信息的前向传播和误差的后向传播将不断地进行调整,逐步优化目标函数。
[0024]相较于现有技术,本专利技术具有以下有益效果:本专利技术能够有效的学习用户与用户之间和产品与产品之间的内联关系,并通过用户层次和产品层次的分层注意力网络,最终识别出文本的情感类别。
附图说明
[0025]图1为本专利技术融合图卷积神经网络的文本情感分类系统的示意配置图。
具体实施方式
[0026]下面结合附图,对本专利技术的技术方案进行具体说明。
[0027]图1示出了根据本专利技术的实施例,在融合图卷积神经网络的文本情感分类系统的示意配置图。如图1所示,根据本专利技术实施在融合图卷积神经网络的文本情感分类系统包括:
[0028]数据预处理模块1,用于构造用户与用户关系图、用户与产品关系图;文本预处理模块2,用于视角级文本进行特征化处理;基于循环神经网络编码模块3,用于获取单词级别和句子级别的编码;基于图卷积神经网络的用户和产品特征提取模块4,通过图卷积神经网络能够很好的将自身节点特征与邻居节点的特征结合在一起,学习用户与用户之间的内联关系,产品与产品之间的内联关系,得到更好的用户和产品的向量表示;用户产品记忆模块5,通过高维矩阵对有代表性的用户和产品信息进行存储,并使用一种门机制更新矩阵;注意力机制模块6,分别使用用户层次和产品层次的注意力机制,获取句子向量表示和文档向量表示;情感类别输出模块7,利用分类函数得到最终的情感分类结果。下面分别详细描述各模块配置。
[0029]1)数据预处理模块1
[0030]首先,数据预处理模块1是描述如何构建用户与用户关系图,用户与产品关系图。
[0031]用户与用户关系图:G
uu
=(U,E
uu
),其中U本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合图卷积神经网络的文本情感分类系统,其特征在于,包括:一数据预处理模块,用于构造用户与用户关系图和用户与产品关系图;一评论文本预处理模块,用于对文档文本进行特征化处理;一基于循环神经网络的编码模块,获取单词级别和句子级别的编码;一基于图卷积神经网络的用户和产品特征提取模块,获取用户和产品的向量表示;一用户产品记忆模块,获取具有代表性的用户和产品信息的向量表示;一注意力机制模块,分别获取用户和产品的句子和文档表示向量;一预测情感极性模块,利用分类函数得到最终的情感分类结果。2.根据权利要求1所述的融合图卷积神经网络的文本情感分类系统,其特征在于,所述数据预处理模块,根据文档中的用户信息、产品信息、标签信息,构造用户与用户关系图和用户与产品关系图。3.根据权利要求1所述的融合图卷积神经网络的文本情感分类系统,其特征在于,所述评论文本预处理模块,利用SkipGram模型提取文本的语义向量。4.根据权利要求1所述的融合图卷积神经网络的文本情感分类系统,其特征在于,所述基于循环神经网络的编码模块,利用双向LSTM对单词和句子进行编码,捕捉单词和句子的上下文信息,获取单词...

【专利技术属性】
技术研发人员:廖祥文林建洲陈甘霖林树凯王灿杰
申请(专利权)人:福州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1